機械翻訳

自然言語処理シリーズ 4

機械翻訳

  • 奥村 学 東工大教授 工博 監修
  • 渡辺 太郎 グーグル(株) 博士(情報学)
  • 今村 賢治 情報通信研究機構((株)ATR-Trekより出向) 博士(工学)
  • 賀沢 秀人 グーグル(株) 博士(工学)
  • Neubig, Graham 奈良先端科学技術大学院大助教 博士(情報学)
  • 中澤 敏明 科学技術振興機構 博士(情報学)

機械学習および統計的手法に基づいた統計的機械翻訳を中心に詳しく解説した。

ジャンル
発行年月日
2014/02/21
判型
A5
ページ数
328ページ
ISBN
978-4-339-02754-9
機械翻訳
在庫あり
2営業日以内に出荷致します。

定価

4,620(本体4,200円+税)

カートに入れる

電子版を購入

購入案内

  • 内容紹介
  • 目次
  • 著者紹介
  • 広告掲載情報

本書では,機械学習および統計的手法に基づいた統計的機械翻訳を中心に解説しながら,その構成要素である複雑な統計モデルに基づいた様々な要素技術について,「どのように実現しているのか」をその基礎的な知識まで詳細に説明した。

1. 機械翻訳
1.1 歴史
 1.1.1 初期の機械翻訳
 1.1.2 ALPACレポート
 1.1.3 実用システム
 1.1.4 データに基づく手法
1.2 知識に基づく機械翻訳
 1.2.1 言語のずれと翻訳の難しさ
 1.2.2 要素合成原理
 1.2.3 翻訳のレベル
 1.2.4 解析
 1.2.5 変換
 1.2.6 生成
 1.2.7 その他の話題
1.3 用例に基づく機械翻訳
 1.3.1 事例ベース推論としての機械翻訳
 1.3.2 用例の検索と修正
 1.3.3 複数用例の利用
 1.3.4 組合せの手がかり
 1.3.5 最適な用例の組合せ
 1.3.6 複雑な組合せ
 1.3.7 今後の発展
1.4 統計的機械翻訳
 1.4.1 暗号解読としての機械翻訳
 1.4.2 モデル
 1.4.3 学習
 1.4.4 デコード
 1.4.5 最適化
1.5 まとめ
章末問題

2. 機械翻訳の評価
2.1 機械翻訳を評価するとは
 2.1.1 機械翻訳の用途
 2.1.2 ブラックボックス評価・ガラスボックス評価
 2.1.3 内的評価・外的評価
2.2 主観評価
 2.2.1 グレード評価(N段階評価)
 2.2.2 一対比較/ランキング
 2.2.3 人間翻訳編集率
 2.2.4 評価者について
 2.2.5 評価の一致
2.3 自動評価
 2.3.1 WER
 2.3.2 TER
 2.3.3 BLEU
 2.3.4 METEOR
 2.3.5 RIBES
 2.3.6 自動評価のメタ評価
2.4 評価結果に基づく差分の検出
 2.4.1 統計的に有意な差
 2.4.2 評価値の信頼区間
 2.4.3 対比較の有意差検定
2.5 まとめ
章末問題

3. 言語モデル
3.1 n-gramモデルの基礎
3.2 n-gramモデルの平滑化
 3.2.1 線形補間
 3.2.2 Witten–Bell法
 3.2.3 絶対割引法
 3.2.4 Kneser–Ney法
 3.2.5 その他の平滑化法
 3.2.6 未定義語への対応
3.3 言語モデルの評価
 3.3.1 尤度・対数尤度
 3.3.2 エントロピー・パープレキシティ
 3.3.3 カバレージ
3.4 学習データと言語モデル性能
3.5 言語モデルの格納・参照
3.6 クラスn-gramモデル
3.7 まとめ
章末問題

4. 単語アライメント
4.1 ヒューリスティックモデル
4.2 IBMモデル
 4.2.1 アライメントに基づくモデル
 4.2.2 稔性に基づくモデル
 4.2.3 学習
4.3 両方向モデル
 4.3.1 ヒューリスティック
 4.3.2 事後確率によるフィルタリング
 4.3.3 学習時の制約
4.4 教師あり単語アライメント
 4.4.1 単語アライメントの評価
 4.4.2 識別学習によるアライメント
4.5 まとめ
章末問題

5. 句に基づく機械翻訳
5.1 句に基づく翻訳モデル
5.2 句に基づくモデルの学習
5.3 対数線形モデル
5.4 デコーダ
 5.4.1 巡回セールスマン問題
 5.4.2 動的計画法に基づくアルゴリズム
 5.4.3 グラフ構造
 5.4.4 半環
 5.4.5 k-bestの導出
 5.4.6 探索空間の制約
 5.4.7 ビーム探索
 5.4.8 ヒューリスティック関数
5.5 フレーズペアの事前並び替え
 5.5.1 事前並び替えルール
 5.5.2 事前並び替えモデル
 5.5.3 事前並び替え学習
5.6 まとめ
章末問題

6. 木構造に基づく機械翻訳
6.1 文脈自由文法
 6.1.1 構文解析
 6.1.2 演繹システム
 6.1.3 超グラフ
 6.1.4 半環構文解析
 6.1.5 k-best導出
6.2 同期文脈自由文法
 6.2.1 同期文脈自由文法の特徴
 6.2.2 同期文脈自由文法の学習
 6.2.3 統語論的ラベルの導入
 6.2.4 素性
 6.2.5 デコーディング
 6.2.6 リスコア
6.3 同期木置換文法
 6.3.1 同期木置換文法の特徴
 6.3.2 同期木置換ルールの学習
 6.3.3 素性
 6.3.4 デコーディング
 6.3.5 二分化
6.4 二言語同期解析
 6.4.1 反転トランスダクション文法
 6.4.2 スパン枝刈り
 6.4.3 ビーム探索
 6.4.4 二段解析
6.5 まとめ
章末問題

7. 最適化
7.1 準備
7.2 バッチ学習
 7.2.1 エラー最小化学習
 7.2.2 確率モデル
 7.2.3 マージン最大化
 7.2.4 ベイズリスク最小化
7.3 オンライン学習
 7.3.1 エラー関数の近似
 7.3.2 学習アルゴリズム
 7.3.3 スパースな素性
 7.3.4 並列化
7.4 まとめ
章末問題

付録 機械翻訳のための資源・ツール
A.1 対訳データ
A.2 文書・文アライメント
A.3 翻訳評価
A.4 言語モデル
A.5 単語アライメント
A.6 機械翻訳システム

引用・参考文献
章末問題解答
索引

奥村 学(オクムラ マナブ)

渡辺 太郎(ワタナベ タロウ)

今村 賢治(イマムラ ケンジ)

賀沢 秀人(カザワ ヒデト)

Neubig, Graham(ニュービッグ グラハム)

中澤 敏明(ナカザワ トシアキ)

掲載日:2020/06/18

「自然言語処理」27巻第2号(2020年6月)

人工知能関連書籍 特設ページ開設中!人工知能関連の書籍をまとめました。

関連資料(一般)

関連資料一覧