書名で キーワードで

詳細検索 >>

HOME  > 電気・電子工学  / 音響  / 音声  > 音声分析合成

書籍詳細

音響テクノロジーシリーズ 22)

  音声分析合成

▼ 目次を読む

▼ 目次をたたむ

森勢将雅 山梨大准教授 博士(工学) 著

… 著者ホームページです

発行年月日:2018/08/06 , 判 型: A5,  ページ数:272頁

ISBN:978-4-339-01137-1,  定 価:4,320円 (本体4,000円+税)

ジャンル:

音声を何らかのパラメータとして表現し,表現されたパラメータから音声波形を生成する信号処理技術の総称を音声分析合成と呼ぶ。本書では,音声分析合成システムを理解・研究する際に必要となる知識を習得できるようにまとめた。

【目次】

1. 基礎知識
1.1 本書で共通する数学的知識
 1.1.1 音声波形とスペクトルについて
 1.1.2 スペクトルの振幅,位相
 1.1.3 群遅延
1. 基礎知識
1.1 本書で共通する数学的知識
 1.1.1 音声波形とスペクトルについて
 1.1.2 スペクトルの振幅,位相
 1.1.3 群遅延
 1.1.4 信号の平均時間と持続時間
 1.1.5 スペクトルを用いた平均時間と持続時間の表現
 1.1.6 不確定性原理
 1.1.7 畳み込み
 1.1.8 ディジタルフィルタ
 1.1.9 z変換によるディジタルフィルタの特性解析
 1.1.10 窓関数による波形の短時間分析とスペクトログラム
 1.1.11 瞬時周波数
1.2 音声の収録
 1.2.1 マイクロフォンによる音声の取り込み
 1.2.2 近接効果
 1.2.3 収録環境の騒音レベル
 1.2.4 収録環境の残響時間
 1.2.5 信号対雑音比(SNR)
1.3 A-D変換
 1.3.1 標本化と量子化
 1.3.2 折り返しひずみ
 1.3.3 高品質な音声分析合成に求められる水準
引用・参考文献

2. 音声のパラメータ表現
2.1 音声の生成メカニズムと音声の分類
 2.1.1 有声音の発声メカニズム
 2.1.2 無声音の発声メカニズム
2.2 音声を構成するパラメータ
 2.2.1 基本周波数
 2.2.2 スペクトル包絡
 2.2.3 非周期性指標
 2.2.4 有声音の定式化
2.3 伝統的な音声分析合成システム
 2.3.1 ボコーダ(非周期性指標を不使用)
 2.3.2 ボコーダ(非周期性指標を使用)
 2.3.3 フェーズボコーダ
 2.3.4 正弦波モデル
2.4 本章のまとめ
引用・参考文献

3. 基本周波数の推定
3.1 古典的な方法
 3.1.1 ゼロ交差法
 3.1.2 自己相関法
 3.1.3 ケプストラム法
 3.1.4 共通する問題点
3.2 精度を高めるための工夫
 3.2.1 相関法の改良
 3.2.2 ゼロ交差法の改良
3.3 実用レベルにある最先端の方法
 3.3.1 基本周波数候補の推定
 3.3.2 基本周波数軌跡の推定
 3.3.3 最終的な軌跡の確定と平滑化
3.4 基本周波数推定法の性能評価
 3.4.1 Electroglottography(EGG)を用いた真値の定義
 3.4.2 評価指標
 3.4.3 基本周波数評価における課題
引用・参考文献

4. スペクトル包絡の推定
4.1 線形予測符号
 4.1.1 問題設定
 4.1.2 最適係数の導出
 4.1.3 LPCの妥当性
 4.1.4 LPCの問題点
4.2 ケプストラム
 4.2.1 ケプストラムによるスペクトル包絡推定
 4.2.2 ケプストラムの問題点
4.3 高品質音声分析合成のための課題の整理
4.4 STRAIGHT
 4.4.1 STRAIGHTで用いる窓関数
 4.4.2 平滑化とスペクトル補償
 4.4.3 スペクトル補償の意味
4.5 分析時刻に非依存なスペクトル包絡推定の前提知識
 4.5.1 スペクトルの離散化
 4.5.2 窓関数により切り出す時刻の影響
 4.5.3 分析時刻に依存した成分の定式化
4.6 TANDEM-STRAIGHT
 4.6.1 TANDEM
 4.6.2 平滑化とスペクトル補償
4.7 CheapTrick
 4.7.1 分析時刻に依存した項の再解釈
 4.7.2 窓関数の設計
 4.7.3 パワースペクトルの変形
 4.7.4 平滑化とスペクトル補償
4.8 スペクトル包絡推定法の性能評価
 4.8.1 対数スペクトルに対するユークリッド距離
 4.8.2 板倉・斎藤距離
 4.8.3 周波数軸上で重み付けされた板倉・斎藤距離
 4.8.4 スペクトル包絡推定評価の課題
引用・参考文献

5. 非周期性指標の推定
5.1 前提となる考え方
 5.1.1 雑音が重畳された音声の定義
 5.1.2 HNR
 5.1.3 非周期性指標推定の目標
5.2 STRAIGHTで用いる推定法
 5.2.1 基本的な考え方
 5.2.2 時間軸の非線形伸縮
 5.2.3 非周期性指標推定
5.3 TANDEM-STRAIGHTで用いる推定法
 5.3.1 基本的な考え方
 5.3.2 非周期性指標推定
5.4 WORLDで用いる推定法
 5.4.1 基本的な考え方
 5.4.2 具体的な推定アルゴリズム
引用・参考文献

6. 高精度に計算するコツ
6.1 窓関数による波形の厳密な切り出し
 6.1.1 窓関数の厳密な設計
 6.1.2 0Hz成分の厳密な除去
6.2 スペクトル包絡推定における0Hz成分の扱い
 6.2.1 0Hz成分が推定結果に与える影響
 6.2.2 0Hz成分の制御
6.3 高精度なスペクトルフィルタリング
 6.3.1 線形補間による矩形窓の畳み込み
 6.3.2 リフタリングを用いた方法
6.4 1サンプル未満の遅延の制御
 6.4.1 サブハーモニックの影響
 6.4.2 微細な遅延の付与
6.5 波形生成時における0Hz成分の除去
 6.5.1 0Hz成分の除去が知覚に与える影響
 6.5.2 適切な0Hz成分の除去
6.6 ボコーダにおける無声音の扱い
 6.6.1 問題の設定
 6.6.2 スペクトル包絡推定・波形生成における無声音の扱い
6.7 瞬時周波数計算における注意点
 6.7.1 窓関数の影響
 6.7.2 瞬時周波数計算における窓関数の差
 6.7.3 発散する時刻の瞬時周波数
引用・参考文献

7. 音声の加工技術
7.1 基本周波数の加工
 7.1.1 基本的な加工
 7.1.2 抑揚の大きさの加工
 7.1.3 基本周波数操作を行うための軸変換
7.2 スペクトル包絡の加工
 7.2.1 加工に関する基本的な考え方
 7.2.2 フィルタリングによるスペクトル包絡の加工
 7.2.3 スペクトル包絡の伸縮による音色の加工
7.3 発話時間の加工
7.4 複数パラメータを組み合わせた加工
 7.4.1 性別の変換
 7.4.2 有声音のささやき声化
 7.4.3 音高錯覚
7.5 音声モーフィング
 7.5.1 時間・周波数軸上のラベル付け
 7.5.2 時間・周波数軸の非線形伸縮
 7.5.3 伸縮された時間周波数表現における加重平均
 7.5.4 モーフィングの拡張
7.6 歌声合成への応用
 7.6.1 歌声の高さに関する単位
 7.6.2 微細構造
 7.6.3 ビブラート
 7.6.4 音高遷移に関する歌唱表現
 7.6.5 歌唱フォルマント
引用・参考文献

8. 音声品質の主観評価方法
8.1 音声分析合成法に関する主観評価のおもな流れ
 8.1.1 目的に基づく評価法の設計
 8.1.2 実験規模の設計
 8.1.3 実験結果の解析
8.2 共通する実験の前処理
 8.2.1 音声の音圧レベルの正規化
 8.2.2 実験刺激のランダム提示
 8.2.3 実験環境の記録
8.3 リファレンスの有無にかかわらず利用できる評価法
 8.3.1 MOS評価
 8.3.2 一対比較法
8.4 リファレンスに対する変化を測る評価法
 8.4.1 DMOS評価
 8.4.2 CMOS評価
引用・参考文献

索引

在庫は時期によりまして変動することがございますので、ご了承ください。