改訂 音声

音響工学講座 7

改訂 音声

音声研究の歴史や,音声の線形予測分析・合成などの基礎的な事項を詳述し,さらに音声認識・雑音対策などの最新技術について,背景となる考え方や着想などを,わかりやすく解説した。旧版を全面的に新しく書き改めた。

ジャンル
発行年月日
1995/02/20
判型
A5
ページ数
164ページ
ISBN
978-4-339-00359-8
改訂 音声
品切・重版未定
当面重版の予定がございません。

定価

2,750(本体2,500円+税)

購入案内

  • 内容紹介
  • 目次
  • 著者紹介

音声研究の歴史や,音声の線形予測分析・合成などの基礎的な事項を詳述し,さらに音声認識・雑音対策などの最新技術について,背景となる考え方や着想などを,わかりやすく解説した。旧版を全面的に新しく書き改めた。

1. 音声と音声研究の歴史
1.1 音声とは
1.2 音声研究の歴史と現状
1.3 音声研究の流れ(立場)と関連分野
  1.3.1 音声研究の流れ
  1.3.2 音声研究の関連分野
  1.3.3 本書の構成
参考文献
2. 音声波形の統計的特性
2.1 音声波形の特性
  2.1.1 振幅の統計分布
  2.1.2 スペクトル分布
  2.1.3 基本周波数の分布
  2.1.4 音節,音素の時間長
2.2 音声波形の自己相関
  2.2.1 相関分析
参考文献
3. 音声の生成過程とそのモデル化
3.1 音声の生成過程
  3.1.1 音声の生成と分類
3.2 音声の生成モデル
  3.2.1 音声生成の音響モデル
3.3 音声生成モデルの高度化
  3.3.1 モデルの高度化
  3.3.2 声道内音波伝搬の高度化
  3.3.3 声道境界条件の高度化
  3.3.4 声帯モデルの高度化
参考文献
4. 音声の分析
4.1 分析の基本的な考え方
4.2 スペクトル分析
4.3 ケプストラム分析
4.4 線形予測分析
  4.4.1 全極形システム分析
  4.4.2 音源分析
4.5 偏自己相関分析
  4.5.1 偏自己関数
4.6 音声分析の問題点とその対策
  4.6.1 線形予測音声分析の問題点
  4.6.2 全極モデルから極・零モデルへ
  4.6.3 有声音源の効果の軽減
  4.6.4 時変系としての分析
4.7 ウェーブレット分析
  4.7.1 ウェーブレット分析
付録4.1 αケプストラムの計算
付録4.2 線形予測分析の原理と仕事
付録4.3 離散全極モデル(DAPM)分析の原理説明
付録4.4 DAP分析における∂α/∂ρ,∂α/∂ωの計算
付録4.5 適応分析によるホルマント抽出法
参考文献
5. 音声の合成
5.1 合成の意義と考え方
  5.1.1 音声合成とは
  5.1.2 音声合成の意義
5.2 音声合成の実際
  5.2.1 音声合成の分類
  5.2.2 録音編集方式
  5.2.3 ホルマント形合成
  5.2.4 線形予測係数による合成
  5.2.5 偏自己相関係数合成
  5.2.6 線スペクトル対合成
5.3 一般的な音声合成
  5.3.1 合成の単位
  5.3.2 合成のための制御
5.4 音声合成の応用
  5.4.1 音声応答
  5.4.2 音声案内
  5.4.3 音声出力
  5.4.4 音声合成の将来
付録5.1 LSP(線スペクトル対)の求め方
参考文献
6. 音声の高能率符号化
6.1 高能率符号化の必要性
6.2 最適スカラ量子化
  6.2.1 スカラ量子化
  6.2.2 差分および適応符号化
6.3 ベクトル量子化
6.4 CELP方式
  6.4.1 CELP方式の基本
  6.4.2 短期予測と長期予測
  6.4.3 CELP方式の展開(新CELP方式)
6.5 逐次適応推定符号化
6.6 音質評価
  6.6.1 音質の評価
  6.6.2 明瞭度
  6.6.3 総合的な音質評価(オピニヨン等価Q値)
参考文献
7. 音声の認識
7.1 音声認識の試みと困難さ
7.2 限定語彙・特定話者・単語認識
  7.2.1 概観
  7.2.2 ダイナミックプログラミング
7.3 不特定話者音声認識
  7.3.1 音声の個人差
  7.3.2 音声特性の話者変動とその対策
  7.3.3 マルコフモデルと隠れマルコフモデル
  7.3.4 隠れマルコフモデルによる音声認識
  7.3.5 モデルの推定(学習):Baum-Welch法
  7.3.6 事後確率(尤度)の計算
  7.3.7 HMMによる音声認識の実例
  7.3.8 HMMの拡張
  7.3.9 HMnet方式
7.4 神経回路網による音声認識
  7.4.1 概観
  7.4.2 神経素子
  7.4.3 多層パーセプトロンと誤差逆伝搬法
7.5 神経回路網による音声認識
参考文献
8. 話者認識と声性変換
8.1 音声の個人性
8.2 話者認識
  8.2.1 話者認識の必要性
  8.2.2 話者照合技術
  8.2.3 話者認識(照合)の問題点と対策
  8.2.4 話者認識の技術の実際
8.3 声性変換
  8.3.1 声性変換の必要性
  8.3.2 音声の感情(印象)性
参考文献
9. 音声処理の雑音対策
9.1 雑音対策の必要性
  9.1.1 雑音処理の必要性と目的
  9.1.2 雑音対策の技術的分類
9.2 スペクトル差引法
  9.2.1 基本形とその展開
9.3 雑音対策の定式化
  9.3.1 音声と雑音のモデル
  9.3.2 信号の推定(目的1の場合)
  9.3.3 ベクトル量子化(目的2の場合)
  9.3.4 MAP(最尤)推定規則(目的3の場合)
9.4 HMMモデルによる雑音低減
  9.4.1 信号の推定(目的1の場合)
  9.4.2 信号の符号化(目的2の場合)
  9.4.3 信号の分類(目的3の場合)
  9.4.4 雑音低減の効果
参考文献
10. 音声と言語
10.1 音声と言語
  10.1.1 音声と言語の関係
  10.1.2 言語情報の表現
10.2 連続自然音声の認識
参考文献
索引

中田 和男(ナカダ カズオ)