レビュー,書籍紹介・書評掲載情報

音声(上)

音響学講座 6

音声(上)

音声の教科書として利用できるように前半では,音声研究の歴史,基礎的な音声分析アルゴリズム,音声生成メカニズムとモデルなどについて詳細に述べた。また後半では,応用研究として音声合成,雑音除去について説明した。

発行年月日
2021/09/22
定価
4,840(本体4,400円+税)
ISBN
978-4-339-01366-5
在庫あり

レビュー,書籍紹介・書評掲載情報

読者モニターレビュー【 N/M 様(ご専門:総合情報学(情報科学))】

掲載日:2021/09/14

本書は,音響学講座シリーズ(全10巻)の6巻目に位置する書籍で,「音声」(基礎的な音声分析アルゴリズム,音声生成メカニズム,音声合成,雑音除去)についての記述がなされている.なお,私自身『音響学の展開(音響学講座 10)』を先に読んでいる以外の専門的な知識は,ほぼない.

第1章では,音声に関する分野へのイントロダクション(導入)的な内容が述べてある.具体的には,人が音声を生成・認識するとはどういうことで,どういった過程で行われるかという,日常生活においては当たり前ではあるけど,それらについて改めて考えるきっかけにもなると思う.また,どの分野でもはじめて学ぶ際に,その分野がどのような歴史的背景を持って確立されていったかが重要だと個人的には思っており,本書でも音声研究の歴史と現状として,音声インタフェース,音声そのものや,分析・合成・認識の各分野での歴史や研究成果が,数多くの和書・洋書の書籍や論文を基に解説されてある.最後に,音声研究と関連のある分野や,音声研究の応用分野として活用例について解説されている.私自身の専門分野である,情報関連の分野を少し取り上げると,音声を解析する際の数理的に音声を解析したりする方法(アルゴリズム)や,音声のパターン認識をする際にAI(Artificial Intelligence; 人工知能),ディープラーニング(深層学習)など用いて,応用することが可能である.

また,第1章では概論的に紹介されていることは,後ほどの第2章以降で詳しく,文書として解説してあるだけでなく,ときには図解や数式による定義がなされている.

第2章では,音声波形の特性,第3章では,音声の生成機構とそのモデル,第4章では,音声の分析,第5章では,音声合成,第6章では,音声処理の雑音対策など,音声にまつわる各種技術を,論文をベースにしつつ,分かりやすく記述されてある.

さらに,第4章については,本書の内容を発展的に学びたい方のために.『式の導出に関する参考資料』として参考1〜参考26までのPDFファイル(全35ページ)がWebページにアップロードされている.本書の付録として「A.1 直交原理の証明」,「A.2 複素関数の微分」と,このPDF資料は,数理的な意味合いを深く理解する上でも重要だと思われるので,数式を読み解くことにアレルギー反応のない方は是非チャレンジしてみると良いだろう.

最後に,本書は『音声(上)』とあるように,上巻に位置する書籍なので,後に出版される下巻に位置する書籍『音声(下)』では,音声認識,音響モデルとその高度化,言語モデルとその高度化,話者認識,音声対話システムなどが取り上げられる予定である.音声に関する分野について網羅できるだろうと考えられるので,本書だけに留まらず『音声(下)』についても,引き続き読まれることをオススメする.