音響サイエンスシリーズ 18
音声言語の自動翻訳 - コンピュータによる自動翻訳を目指して -
近年ようやく実用化の緒に就いたコンピュータによる通訳について,話し言葉の本質や通訳に関する科学的知見に基づき解説。
- 発行年月日
- 2018/07/10
- 判型
- A5
- ページ数
- 192ページ
- ISBN
- 978-4-339-01338-2
- 内容紹介
- まえがき
- 目次
- 広告掲載情報
近年ようやく実用化の緒に就いたコンピュータによる通訳について,話し言葉の本質や通訳に関する科学的知見に基づき解説した1冊。さらに,今後いかにコンピュータが人間の通訳者に迫るかについて議論している。
話した言葉をその場で相手の言語に翻訳して,あたかも母国語で話しているかのようなコミュニケーションを可能とするのが,自動音声翻訳あるいは音声自動通訳システムと呼ばれるものである。すでに,種々のSF映画や漫画では当たり前のように出てくる技術であるが,長い研究開発の末,ようやく実現が近付いてきた。特に,日本人の外国語への苦手意識がきわめて高いことから,わが国では世界に先駆けて音声翻訳の研究が,1986年に国際電気通信基礎技術研究所の中の自動音声翻訳研究所において開始された。筆者の中村はその発足から3年間プロジェクトに参加,さらに,2000年から2011年までプロジェクトを率いる立場で参画した。その中で,コーパスベースの確率モデルによる統計的な音声認識・合成や機械翻訳へのパラダイムシフト,多言語化のための国際共同研究,標準化,種々の実証実験,携帯電話による音声翻訳の実用化などを経験,主導した。本書ではこれらの活動を通した,これまでの自動音声翻訳・自動音声通訳技術の研究開発について述べていく。
本書は,筆者の中村が2011年に奈良先端科学技術大学院大学に異動し,知能コミュニケーション研究室で,共著者の戸田,Sakti,Neubigとともに音声自動通訳の基礎研究を行ったことを機に執筆を決心した。それぞれ,音声翻訳のプロジェクトを率いてきた中村,音声合成および声質変換の専門家である戸田と高道,多言語音声認識の専門家であるSakti,そして,機械翻訳の専門家であるNeubigという,執筆時点で研究の先端を行く筆者が本執筆を担当した。
本書の出版においては,音響サイエンスシリーズ編集委員会 委員長の富山県立大学の平原達也教授に本書のご提案をいただいた。また,コロナ社には企画から原稿の出版まで長きにわたり大変ご尽力をいただいた。また,これまで音声翻訳の研究開発をともに進めてきた株式会社 エイ・ティ・アール自動翻訳電話研究所,音声翻訳通信研究所,音声言語通信研究所,株式会社国際電気通信基礎技術研究所・音声言語コミュニケーション研究所,情報通信研究機構の共同研究者の皆様,音声翻訳の研究に継続的に資金提供していただいた総務省,文部科学省,内閣府の皆様,そして,奈良先端科学技術大学院大学情報科学研究科知能コミュニケーション研究室のスタッフ,学生諸君に感謝する。
2018年3月中村 哲
1. 音声翻訳の概要
1.1 音声翻訳システム
1.2 自動音声翻訳のこれまで
引用・参考文献
2. 話し言葉の異言語コミュニケーション
2.1 話し言葉の性質
2.2 コミュニケーションとはなにか
2.3 言語情報と非言語情報の役割
引用・参考文献
3. 自動音声翻訳の構成要素
3.1 音声翻訳モデル
3.2 音声認識
3.2.1 音声認識システムの概要
3.2.2 音声認識技術のマイルストーン
3.2.3 音声認識技術
3.3 機械翻訳
3.3.1 人間の翻訳と機械の翻訳
3.3.2 機械翻訳の難しさ
3.3.3 翻訳システムの作り方
3.3.4 対訳データの収集・対応付け
3.3.5 フレーズベース翻訳
3.3.6 木に基づく翻訳
3.3.7 ニューラルネットに基づく機械翻訳
3.3.8 翻訳結果の評価
3.3.9 機械翻訳の現状と未解決問題
3.4 音声合成
3.4.1 音声合成の歴史
3.4.2 テキスト音声合成の仕組み
3.4.3 統計的パラメトリック音声合成方式
3.4.4 非言語情報およびパラ言語情報の制御
3.4.5 合成音声の評価
3.4.6 音声合成の現状と今後の課題
引用・参考文献
4. 音声翻訳の研究プロジェクトとシステム
4.1 ATRとNICTプロジェクト
4.1.1 ATRプロジェクト
4.1.2 NICTプロジェクト
4.2 世界のおもな音声翻訳プロジェクト
4.3 国際共同研究と音声翻訳標準化
4.3.1 C-STAR
4.3.2 A-STAR
4.3.3 IWSLT
4.3.4 国際標準化
4.3.5 U-STAR
引用・参考文献
5. 音声同時通訳
5.1 同時通訳者の処理と認知モデル
5.2 コンピュータはいかに同時通訳者に迫るか
5.2.1 翻訳タイミングの決定
5.2.2 未発話内容の予測
5.2.3 表現の工夫
5.2.4 同時音声翻訳システムの評価
引用・参考文献
6. 究極の音声翻訳
6.1 理想的な音声翻訳モデル
6.2 パラ言語音声翻訳
6.3 音声画像翻訳
6.4 speech-chainへの挑戦
6.5 end-to-end音声翻訳
6.6 音声翻訳の課題と今後
引用・参考文献
あとがき
索引
-
掲載日:2021/08/02
-
掲載日:2021/03/01
-
掲載日:2020/06/18
-
掲載日:2020/03/04
-
掲載日:2020/01/09