音声言語処理と自然言語処理 (増補)

音声言語処理と自然言語処理 (増補)

音声言語処理と自然言語処理を有機的に関連付け,工学的応用を目的とした基礎技術について解説した。

ジャンル
発行年月日
2018/09/20
判型
A5
ページ数
302ページ
ISBN
978-4-339-02888-1
音声言語処理と自然言語処理 (増補)
在庫あり

定価

3,520(本体3,200円+税)

カートに入れる

購入案内

  • 内容紹介
  • 目次
  • レビュー
  • 著者紹介

音声言語処理と自然言語処理を有機的に関連付け,音声認識/音声合成/テキスト解折/検索/質問応答/機械翻訳/対話などを目的とした基礎技術について解説した。増補版では深層ニューラルネットワークによる方法を追加・解説した。

1. 音声と言語の諸相
1.1 音声科学と音声工学
1.2 言語科学と言語工学
1.3 音声学,音韻論と言語学
 1.3.1 音声学,音韻論
 1.3.2 言語学
1.4 話し言葉と書き言葉
 1.4.1 話し言葉の特徴
 1.4.2 書き言葉の特徴
1.5 言語の獲得
 1.5.1 音韻,音韻の構造,音韻体系の獲得
 1.5.2 文法の獲得と第2言語の学習
章末問題

2. 音声言語処理のモデル
2.1 音声の音響的分析とそのモデル
 2.1.1 音声生成のメカニズムとそのモデル
 2.1.2 音声に含まれる情報とその音響的対応物
 2.1.3 音声の記号化
 2.1.4 音声の音響的分析
 2.1.5 時間構造の異なる2つの特徴ベクトル系列の対応付け
2.2 音声の認識とそのモデル
 2.2.1 音声認識の難しさ
 2.2.2 音声認識問題の数理統計的な定式化
 2.2.3 音響モデル
 2.2.4 言語モデル
 2.2.5 仮説探索(デコーディング)
2.3 音声の合成とそのモデル
 2.3.1 テキスト音声合成の難しさ
 2.3.2 音韻処理
 2.3.3 韻律処理
 2.3.4 HMM音声合成方式による波形生成
2.4 深層ニューラルネットワークに基づく音声認識と音声合成
 2.4.1 多層化されたニューラルネットワークとその音声処理への応用
 2.4.2 誤差逆伝搬法と自己符号化器を使った事前学習
 2.4.3 GMM-HMMからDNN-HMMへ
 2.4.4 さまざまなネットワーク構造
 2.4.5 DNN/RNN/LSTMを用いた言語モデル
 2.4.6 DNN/RMM/LSTMを用いた音声合成
章末問題

3. 自然言語処理のモデル
3.1 形態素解析
 3.1.1 形態素解析の枠組み
 3.1.2 統計的モデルに基づく形態素解析
 3.1.3 仮名漢字変換
3.2 構文解析
 3.2.1 句構造解析
 3.2.2 係り受け解析
3.3 意味解析
 3.3.1 意味素とシソーラス
 3.3.2 格解析
 3.3.3 語義曖昧性解消
 3.3.4 語彙知識の獲得
3.4 文脈解析
 3.4.1 照応解析
 3.4.2 修辞構造解析
3.5 ニューラルネットワークによる自然言語処理
 3.5.1 単語の分散表現
 3.5.2 依存構造解析
 3.5.3 文の分類
章末問題

4. 検索・質問応答システム
4.1 文字列照合
 4.1.1 完全一致文字列照合のオンライン手法
 4.1.2 近似文字列照合のオンライン手法
 4.1.3 文字列照合のオフライン手法
 4.1.4 近似文字列照合と索引付け
4.2 文書検索
 4.2.1 文書のベクトル表現
 4.2.2 ベクトル空間モデル
 4.2.3 確率的言語モデルによる文書検索
4.3 質問応答
4.4 音声と情報検索
 4.4.1 音声ドキュメント検索の問題設定
 4.4.2 音声ドキュメント検索の課題と手法
章末問題

5. 対話システム
5.1 談話と対話
 5.1.1 談話とは
 5.1.2 対話と会話
 5.1.3 対話の公準
 5.1.4 談話,対話の構造
 5.1.5 対話行為
5.2 対話システム
 5.2.1 対話システムとは
 5.2.2 対話システムの構成
 5.2.3 対話の主導権
5.3 対話制御
 5.3.1 対話制御とは
 5.3.2 有限状態オートマトンによる状態表現を用いた対話制御
 5.3.3 意味表現に基づいた応答生成による対話制御-ケ-ススタディ-
 5.3.4 POMDPによる対話制御
5.4 マルチモーダル対話
 5.4.1 マルチモーダルな状態
 5.4.2 マルチモーダル対話システム
章末問題

6. 翻訳システム
6.1 機械翻訳の歴史と代表的なアプローチ
6.2 規則に基づく機械翻訳
 6.2.1 規則に基づく機械翻訳の概要
 6.2.2 単語変換
 6.2.3 構造変換
 6.2.4 規則に基づく手法の問題点
6.3 コーパスに基づく機械翻訳と統計的機械翻訳
 6.3.1 単語単位の統計的機械翻訳
 6.3.2 フレーズ単位の統計的機械翻訳
6.4 ニューラル機械翻訳
 6.4.1 系列変換モデルによる機械翻訳
 6.4.2 注意機構
6.5 音声翻訳
 6.5.1 テキスト機械翻訳と音声機械翻訳
 6.5.2 音声認識結果の整形
 6.5.3 統計的機械翻訳を用いた音声翻訳
 6.5.4 ニューラル機械翻訳による音声翻訳
章末問題

7. テキスト,音声入力インタフェース
7.1 ヒューマンインタフェース
7.2 テキスト入力インタフェース
7.3 音声入力インタフェース
 7.3.1 テキスト入力の手段としての音声インタフェース
 7.3.2 意図・情報伝達の手段としての音声インタフェース
7.4 マルチモーダル入力インタフェース
章末問題

8. フリーソフトウェアによる演習
8.1 音声分析,ラベリング
8.2 音声認識
8.3 音声合成
8.4 形態素解析
8.5 係り受け解析
8.6 全文検索
8.7 統計的機械翻訳
8.8 深層学習フレームワーク
演習課題

引用・参考文献
章末問題解答
索引

lattice 様

 言語学から数理モデルまで文理融合の幅広い知識が必要とされる、音声言語処理と自然言語処理についてわかりやすく学べる1冊です。
コロナ社から出版されている『自然言語処理の基礎』を読んで非常にわかりやすく興味深かったため、本書を読むことにしました。
音声言語処理のモデルはフーリエ変換からニューラルネットワークまで多岐にわたり、この本で個別の本を読んだり実装を始める前に、概要をつかむことができたのが良かったです。
対話システムや翻訳システムなど実社会でも使われている人間に近いシステムやインタフェースの説明も多く、数式レベルからそれらまでかなり多くの内容を扱っているので、少しずつ噛み砕いて読んでいきたいと思います。
章末問題とその解説、フリーソフトを使った演習も充実していて、読んで終わりにならない身につく内容でした。

小林 聡(コバヤシ サトシ)

宇津呂 武仁(ウツロ タケヒト)