書名で キーワードで

詳細検索 >>

HOME  > 情報工学  / 人工知能・知識工学  / 自然言語処理  > 音声言語処理と自然言語処理

書籍詳細

  音声言語処理と自然言語処理  (増補)

▼ 目次を読む

▼ 目次をたたむ

中川聖一 豊橋技科大名誉教授・中部大教授 工博 編著

小林聡 元島根大准教授 博士(工学) 著

峯松信明 東大教授 博士(工学) 著

宇津呂武仁 筑波大教授 博士(工学) 著

秋葉友良 豊橋技科大准教授 博士(工学) 著

北岡教英 徳島大教授 博士(工学) 著

山本幹雄 筑波大教授 博士(工学) 著

甲斐充彦 静岡大准教授 博士(工学) 著

山本一公 中部大准教授 博士(工学) 著

土屋雅稔 豊橋技科大准教授 博士(情報学) 著

… 著者ホームページです

発行年月日:2018/09/20 , 判 型: A5,  ページ数:302頁

ISBN:978-4-339-02888-1,  定 価:3,456円 (本体3,200円+税)

音声言語処理と自然言語処理を有機的に関連付け,音声認識/音声合成/テキスト解折/検索/質問応答/機械翻訳/対話などを目的とした基礎技術について解説した。増補版では深層ニューラルネットワークによる方法を追加・解説した。

この演習PDFでは,以下のような演習を用意しています。
 ●Praat を用いて,音声のスペクトログラム,ピッチ,フォルマントを観察します(演習時間の目安: 1 時間)。
 ●HTK を用いて,音声データからMFCC を抽出します(演習時間の目安: 2時間)。
 ●HTK を用いて,MFCC から音響モデルを学習し,得られた音響モデルに基づいて音声認識します(演習時間の目安: 4 時間)。
 ●HTK を用いて,数字単位のHMM を学習し,連続数字音声認識を行います(演習時間の目安: 4 時間)。
 ●MeCab を用いて形態素解析し,SRILM を用いて言語モデルを作成します(演習時間の目安: 4 時間)。
 ●CaboCha を用いて係り受け解析と固有表現抽出を行います(演習時間の目安: 2 時間)。
 ●Minise を用いて全文検索を行います(演習時間の目安: 4 時間)。
 ●Moses とGIZA++ を用いて統計的機械翻訳モデルを行います(演習時間の目安: 4 時間)。
3GB以上あります。

【目次】

1. 音声と言語の諸相
1.1 音声科学と音声工学
1.2 言語科学と言語工学
1.3 音声学,音韻論と言語学
 1.3.1 音声学,音韻論
1. 音声と言語の諸相
1.1 音声科学と音声工学
1.2 言語科学と言語工学
1.3 音声学,音韻論と言語学
 1.3.1 音声学,音韻論
 1.3.2 言語学
1.4 話し言葉と書き言葉
 1.4.1 話し言葉の特徴
 1.4.2 書き言葉の特徴
1.5 言語の獲得
 1.5.1 音韻,音韻の構造,音韻体系の獲得
 1.5.2 文法の獲得と第2言語の学習
章末問題

2. 音声言語処理のモデル
2.1 音声の音響的分析とそのモデル
 2.1.1 音声生成のメカニズムとそのモデル
 2.1.2 音声に含まれる情報とその音響的対応物
 2.1.3 音声の記号化
 2.1.4 音声の音響的分析
 2.1.5 時間構造の異なる2つの特徴ベクトル系列の対応付け
2.2 音声の認識とそのモデル
 2.2.1 音声認識の難しさ
 2.2.2 音声認識問題の数理統計的な定式化
 2.2.3 音響モデル
 2.2.4 言語モデル
 2.2.5 仮説探索(デコーディング)
2.3 音声の合成とそのモデル
 2.3.1 テキスト音声合成の難しさ
 2.3.2 音韻処理
 2.3.3 韻律処理
 2.3.4 HMM音声合成方式による波形生成
2.4 深層ニューラルネットワークに基づく音声認識と音声合成
 2.4.1 多層化されたニューラルネットワークとその音声処理への応用
 2.4.2 誤差逆伝搬法と自己符号化器を使った事前学習
 2.4.3 GMM-HMMからDNN-HMMへ
 2.4.4 さまざまなネットワーク構造
 2.4.5 DNN/RNN/LSTMを用いた言語モデル
 2.4.6 DNN/RMM/LSTMを用いた音声合成
章末問題

3. 自然言語処理のモデル
3.1 形態素解析
 3.1.1 形態素解析の枠組み
 3.1.2 統計的モデルに基づく形態素解析
 3.1.3 仮名漢字変換
3.2 構文解析
 3.2.1 句構造解析
 3.2.2 係り受け解析
3.3 意味解析
 3.3.1 意味素とシソーラス
 3.3.2 格解析
 3.3.3 語義曖昧性解消
 3.3.4 語彙知識の獲得
3.4 文脈解析
 3.4.1 照応解析
 3.4.2 修辞構造解析
3.5 ニューラルネットワークによる自然言語処理
 3.5.1 単語の分散表現
 3.5.2 依存構造解析
 3.5.3 文の分類
章末問題

4. 検索・質問応答システム
4.1 文字列照合
 4.1.1 完全一致文字列照合のオンライン手法
 4.1.2 近似文字列照合のオンライン手法
 4.1.3 文字列照合のオフライン手法
 4.1.4 近似文字列照合と索引付け
4.2 文書検索
 4.2.1 文書のベクトル表現
 4.2.2 ベクトル空間モデル
 4.2.3 確率的言語モデルによる文書検索
4.3 質問応答
4.4 音声と情報検索
 4.4.1 音声ドキュメント検索の問題設定
 4.4.2 音声ドキュメント検索の課題と手法
章末問題

5. 対話システム
5.1 談話と対話
 5.1.1 談話とは
 5.1.2 対話と会話
 5.1.3 対話の公準
 5.1.4 談話,対話の構造
 5.1.5 対話行為
5.2 対話システム
 5.2.1 対話システムとは
 5.2.2 対話システムの構成
 5.2.3 対話の主導権
5.3 対話制御
 5.3.1 対話制御とは
 5.3.2 有限状態オートマトンによる状態表現を用いた対話制御
 5.3.3 意味表現に基づいた応答生成による対話制御-ケ-ススタディ-
 5.3.4 POMDPによる対話制御
5.4 マルチモーダル対話
 5.4.1 マルチモーダルな状態
 5.4.2 マルチモーダル対話システム
章末問題

6. 翻訳システム
6.1 機械翻訳の歴史と代表的なアプローチ
6.2 規則に基づく機械翻訳
 6.2.1 規則に基づく機械翻訳の概要
 6.2.2 単語変換
 6.2.3 構造変換
 6.2.4 規則に基づく手法の問題点
6.3 コーパスに基づく機械翻訳と統計的機械翻訳
 6.3.1 単語単位の統計的機械翻訳
 6.3.2 フレーズ単位の統計的機械翻訳
6.4 ニューラル機械翻訳
 6.4.1 系列変換モデルによる機械翻訳
 6.4.2 注意機構
6.5 音声翻訳
 6.5.1 テキスト機械翻訳と音声機械翻訳
 6.5.2 音声認識結果の整形
 6.5.3 統計的機械翻訳を用いた音声翻訳
 6.5.4 ニューラル機械翻訳による音声翻訳
章末問題

7. テキスト,音声入力インタフェース
7.1 ヒューマンインタフェース
7.2 テキスト入力インタフェース
7.3 音声入力インタフェース
 7.3.1 テキスト入力の手段としての音声インタフェース
 7.3.2 意図・情報伝達の手段としての音声インタフェース
7.4 マルチモーダル入力インタフェース
章末問題

8. フリーソフトウェアによる演習
8.1 音声分析,ラベリング
8.2 音声認識
8.3 音声合成
8.4 形態素解析
8.5 係り受け解析
8.6 全文検索
8.7 統計的機械翻訳
8.8 深層学習フレームワーク
演習課題

引用・参考文献
章末問題解答
索引

在庫は時期によりまして変動することがございますので、ご了承ください。