音声音響信号処理の基礎と実践 - フィルタ,ノイズ除去,音響エフェクトの原理 -

次世代信号情報処理シリーズ 2

音声音響信号処理の基礎と実践 - フィルタ,ノイズ除去,音響エフェクトの原理 -

  • 田中 聡久 東京農工大教授 博士(工学) 監修
  • 川村 新 京都産業大教授 博士(工学)

音声・音響に関する信号処理技術を,現場ですぐに活用できる形で,かつ平易に解説する。

ジャンル
発行年月日
2021/04/30
判型
A5
ページ数
220ページ
ISBN
978-4-339-01402-0
音声音響信号処理の基礎と実践 - フィルタ,ノイズ除去,音響エフェクトの原理 -
在庫僅少
在庫が少ない商品です。品切れとなっている場合がございます。

定価

3,630(本体3,300円+税)

カートに入れる

電子版を購入

購入案内

  • 内容紹介
  • まえがき
  • 目次
  • レビュー
  • 著者紹介
  • 広告掲載情報

信号処理の講義は,座学が中心であることに加え,信号処理の応用範囲が,音声,画像,電波など多岐にわたるため,信号処理の基礎理論と応用技術の関連性を受講者がイメージしにくい面がある。このような背景から,応用をイメージした信号処理の学習ができれば効果的であるという考えのもと,本書では音声・音響に焦点を絞り,信号処理の基礎理論と応用技術について,読者ができるだけ現場ですぐに活用できる形で,かつ平易に解説することを心がけて,以下の構成で執筆した。
1章では,音を題材として信号処理技術の基礎を復習する。最初に,ディジタルフィルタの基礎を解説し,低域通過フィルタ,高域通過フィルタ,帯域通過フィルタ,ノッチフィルタの設計方法を述べる。つぎに,ディジタル信号を分析する際に不可欠となる,離散フーリエ変換などの信号変換技術について解説する。さらに,音の信号処理で,頻繁に利用される窓関数とオーバラップ加算について説明する。
2章では,音声の発声原理について述べ,簡単な発声モデルとして音声の分析,合成に有用なソース・フィルタモデルを説明する。さらに,ソース・フィルタモデルを利用した,線形予測分とケプストラム分析について解説する。
3章では,音の周波数成分の時間的な変化を,視覚的に確認することができるスペクトログラムのつくり方について述べる。また,スペクトログラムの応用技術として,画像から音を生成する方法と,その適切な位相スペクトルの生成法,そして,音で任意のスペクトログラムを描画する方法について述べる。
4章では,STFT(短時間フーリエ変換)を用いた周波数分析に基づき,不要な信号を除去する方法について述べる。最初に,マイクロホンを一つとし,統計的性質が変化しないノイズを,音声から除去する方法を説明する。最も単純な方法として,スペクトル減算法を説明し,ついで,ウィーナーフィルタ,MAP(事後確率最大化)推定法について述べる。つぎに,マイクロホンを二つ用いて,二つの音声を分離する方法を説明する。ここでは,バイナリマスキングと呼ばれる単純な手法により,音源のスペクトルを分離する。
5章では,システム同定を題材として,適応アルゴリズムを導出する。さらに,適応フィルタのノイズ除去への応用について説明する。
6章では,エコーをはじめとする各種音響エフェクトの原理と実現方法について述べる。ここで取り上げた音響エフェクトの多くは,リアルタイム処理が可能である。それぞれ比較的簡単な処理で実現できるが,その原理について,理解しておくことは重要である。原理を理解しておけば,自在にアレンジできるので,音楽制作や,ボイスチェンジャなど,応用範囲が格段に広がる。

【読者へのメッセージ】
信号処理に苦手意識がある学生や,音の加工技術についてより深く学びたい技術者の方に向けて,音声・音響に焦点を当てた信号処理の解説書を執筆しました。実用的なフィルタや音の加工技術について,できるだけ平易に,かつすぐに利用できる形でまとめています。本書を通して,音の信号処理,引いては信号処理全般の知識を深め,仕事や趣味に役立てていただけることを願っています。

大学講義の信号処理においては,座学が中心であることに加え,信号処理の応用範囲が,音声,画像,電波など多岐にわたるため,信号処理の基礎理論と応用技術の関連性がイメージしにくい。当然ながら,教科書も汎用性の高い書き方となり,基礎理論を中心に解説される。さまざまな分野に応用できることは述べられているものの,具体的な応用例の提示が限られてしまうことは避けられない。

企業などの開発現場で活躍される方々は,セミナーなどに参加して,大学で学んだはずの信号処理を改めて勉強している。しかし,日々の業務に追われる中で,基礎からの再学習には限界があるのも事実である。そこで,大学生,あるいは信号処理技術を必要とする初学者向けに,応用をイメージした信号処理の学習ができれば効果的であると考えた。本書では,応用技術の中でも,音声・音響に焦点を絞り,信号処理の基礎と応用を解説する。

耳は,目や口と違って閉じることができない。我々人間は,眠っていても,外部の音を鼓膜の振動を通して感じとっている。はるか昔から,人間は音声を発し,それを聞くことで他者との意思疎通をはかり,また,雷鳴や獣の声を聞くことで危険を察知し,回避してきた。話や音楽を聴いてリラックスする,感動する,気分を盛り上げる。耳はたえず働いていて,たった二つの鼓膜の振動だけで,音源の方向や位置の特定,雑音に埋もれた音の抽出,複数の音の選別,さらには人の感情や状態を知ることまでできる。このように,耳,あるいは聴覚は,音を日常的に分析している。

一方,最近の信号処理技術の発展により,音の分析・加工技術が進化してきた。この恩恵を受け,音を人間にとって有益な信号に変換することが,比較的容易にできるようになった。信号処理と音との親和性は高く,信号処理から音を理解する,あるいは逆に,音から信号処理を理解することは有益である。

本書は,音声・音響に関する信号処理技術を,できるだけ現場ですぐに活用できる形で,かつ平易に解説することを心がけて執筆した。しかしながら,筆者はまだまだ未熟,浅学であるため,ごく限られた技術しか扱うことはできず,その解説も拙い部分が多々あることと思われる。ぜひ読者や先輩諸兄からのご指導,ご鞭撻を頂戴したい。一方で,本書が,音声・音響の信号処理技術者にとって,少しでも有益なものとなるならば,筆者にとって最大の喜びである。

2021年2月
川村 新

1.音で復習する信号処理の基礎
1.1 ディジタル信号とフィルタ
 1.1.1 ディジタル信号
 1.1.2 確率信号の記述について
 1.1.3 ディジタルフィルタ
 1.1.4 フィルタの構成要素
 1.1.5 FIRフィルタとIIRフィルタ
 1.1.6 FIRフィルタのインパルス応答
1.2 FIRフィルタの設計
 1.2.1 直線位相FIRフィルタの設計
 1.2.2 低域通過フィルタ(LPF)の設計
 1.2.3 高域通過フィルタ(HPF)の設計
 1.2.4 帯域通過フィルタ(BPF)の設計
1.3 ノッチフィルタの設計
 1.3.1 IIRフィルタのインパルス応答
 1.3.2 IIRフィルタとFIRフィルタの接続
 1.3.3 オールパスフィルタ
 1.3.4 ノッチフィルタ
1.4 離散フーリエ変換
 1.4.1 z変換
 1.4.2 フィルタとz変換の関係
 1.4.3 離散時間フーリエ変換
 1.4.4 離散フーリエ変換
1.5 窓関数
 1.5.1 矩形窓
 1.5.2 ハン窓
 1.5.3 その他の窓関数
1.6 STFTとオーバラップ加算
 1.6.1 ハーフオーバラップ
 1.6.2 STFTの冗長性
 1.6.3 位相スペクトルの復元

2.発声モデル
2.1 ソース・フィルタモデル
 2.1.1 音声の発声の仕組み
 2.1.2 音源と声道フィルタ
 2.1.3 音声のソース・フィルタモデル
 2.1.4 微細構造とスペクトル包絡
 2.1.5 基本周期と基本周波数
2.2 線形予測分析
 2.2.1 予測誤差フィルタ
 2.2.2 音声の合成
 2.2.3 レビンソン・ダービンアルゴリズム
 2.2.4 フォルマント
2.3 ケプストラム分析
 2.3.1 ケプストラム
 2.3.2 スペクトル包絡

3.スペクトログラム
3.1 スペクトログラムの生成
 3.1.1 オーバラップとスペクトログラム
 3.1.2 スペクトログラムの行列表現
3.2 スペクトログラムからの音合成
 3.2.1 位相スペクトルによる合成音の違い
 3.2.2 反復位相復元
3.3 画像の音変換
 3.3.1 画像音響変換
 3.3.2 画像からの合成音生成
 3.3.3 合成音のスペクトログラム
 3.3.4 オーバラップを含む場合の合成音
 3.3.5 ISTFT以外でつくる画像の音
3.4 音で画像を描く
 3.4.1 垂直線の描画
 3.4.2 水平線の描画
 3.4.3 点の描画

4.周波数分析に基づくノイズ除去
4.1 単一マイクロホンによるノイズ除去システム
 4.1.1 スペクトルゲインによるノイズ除去
 4.1.2 スペクトル減算法
 4.1.3 ウィーナーフィルタ
 4.1.4 判定指向法
4.2 事後確率最大化によるノイズ除去
 4.2.1 事後確率
 4.2.2 MAP推定法
 4.2.3 MAP推定によるウィーナーフィルタの導出
 4.2.4 その他のMAP推定によるスペクトルゲイン
 4.2.5 ノイズ除去結果の比較
4.3 音源の分離
 4.3.1 音源位置と観測信号の関係
 4.3.2 会話音声の性質
 4.3.3 バイナリマスキング

5. 適応フィルタ
5.1 システム同定
 5.1.1 システム同定の構成
 5.1.2 評価関数の設定
 5.1.3 フィルタ係数の最適値
 5.1.4 適応アルゴリズム
 5.1.5 最急降下法
 5.1.6 LMSアルゴリズム
 5.1.7 NLMSアルゴリズム
5.2 フィードバックキャンセラ
 5.2.1 音のループが生じる環境
 5.2.2 エコーキャンセラ
 5.2.3 フィードバックキャンセラ
5.3 適応線スペクトル強調器
 5.3.1 適応線スペクトル強調器の原理
 5.3.2 ALEによる音声の白色雑音除去
 5.3.3 ALEによる音声の正弦波ノイズ除去
5.4 突発ノイズ除去
 5.4.1 正弦波に対する線形予測
 5.4.2 線形予測器による正弦波信号の補間
 5.4.3 音声の突発ノイズ除去

6.音響エフェクト
6.1 エコー
 6.1.1 エコーの定式化
 6.1.2 ディレイ
 6.1.3 リバーブ
6.2 正弦波の乗算によるボイスチェンジャ
 6.2.1 正弦波の乗算
 6.2.2 正弦波乗算の効果
 6.2.3 折り返し歪みの影響
 6.2.4 音声に正弦波を乗じた結果
6.3 リングバッファによるボイスチェンジャ
 6.3.1 リングバッファ
 6.3.2 音の高さの変更
 6.3.3 音声に対するリングバッファの長さ
 6.3.4 リングバッファによるボイスチェンジャ
 6.3.5 リングバッファの不連続性を回避する方法
 6.3.6 不連続性を回避したボイスチェンジャの実現
6.4 話速変換とピッチシフタ
 6.4.1 リサンプリング
 6.4.2 もとの信号とリサンプリング後の信号の対応関係
 6.4.3 ディジタル信号から連続時間信号への変換
 6.4.4 リサンプリングの実現
 6.4.5 音声の周期を利用した話速変換
 6.4.6 話速を速くする方法
 6.4.7 話速を遅くする方法
 6.4.8 ピッチシフタ
6.5 ヘリウムボイス
 6.5.1 音速と波長
 6.5.2 声道の共鳴周波数と音速の関係
 6.5.3 スペクトル包絡の伸縮
 6.5.4 ヘリウムボイスの実現
6.6 コンプレッサ
 6.6.1 コンプレッサの基本構成
 6.6.2 ガンマ変換によるコンプレッサ
 6.6.3 ノイズゲート
 6.6.4 ディストーション
6.7 その他の音響エフェクト
 6.7.1 トレモロ
 6.7.2 ビブラート
 6.7.3 コーラス

引用・参考文献
索引

読者モニターレビュー【shinngoushori.com様(ご専門:音楽/音響信号処理)】

音声・音響信号処理を理解するのに必要な内容の説明から入り,徐々に専門的な内容に染まっていきます。ただ読むだけでなく,所々に例題と解答があり,手を動かしながら理解度を確認することができるので,頭がかたくなってきた私にはありがたいです。

本書籍は,信号処理関連の書籍にありがちな難解な数式はほとんどなく,平易に説明してくれています。著者さんの優しさ/ご配慮のおかげで,読みやすさはもちろんのこと,モチベーションの維持,実装のし易さというメリットがあります。

実装といえば,実装に関するヒントも書かれているため,理論よりも実装を重視したい方にもおすすめできます。ある程度のプログラミング経験のある方であれば,MATLABやScilabあるいはPythonなどで,あまり悩まずにコーディングできると思います。

音響信号処理に関する書籍を読んでいると時々,「数学」をやっているのか「音響」をやっているのか分からなくなる時がありますが,豊富な図と分かりやすい数式で「今は音声・音響を勉強している」という気持ちになれる1冊でした。

読者モニターレビュー【あつもり様(ご専門:音・聴覚情報処理)】

この本では,音に特化した信号処理の基礎的な理論が解説がされています。

具体的には信号処理の基本中の基本であるFIR・IIRフィルタや窓関数,STFTといった内容から始まり,線形予測分析・ケプストラム分析といった発声モデル(2章),ノイズ除去(4・5章)のような音響分野における主要な信号処理の理論に展開されていきます。

文系出身の自分には,信号処理の本はまだ敷居が高いなという不安もありましたが,この本に出てくる数式は,簡潔で分かりやすい図や解説のおかげで非常に追いやすく,ワクワクしながら読み進めることができました。

また,適宜挟まれる例題も丁度良い難易度で,理解を深めてくれました。

この本は,音響・音声に特化した内容で信号処理の理論をしっかりと学べる,ありそうであまりなかった一石二鳥の素晴らしい本だと思います。

音の信号処理を扱いたい方には,かなり参考になるのではないでしょうか。

田中 聡久(タナカ トシヒサ)

川村 新

川村 新(カワムラ アラタ)

【略歴】
1990年~1995年 鳥取大学工学部電気電子工学科
1995年~1999年 ABB株式会社 勤務
1999年~2001年 鳥取大学大学院工学研究科博士前期課程
2001年~2003年 鳥取大学大学院工学研究科博士後期課程
2003年~2018年 大阪大学基礎工学部 勤務
2018年~現在 京都産業大学情報理工学部 勤務
【趣味】
ハンドフルートの練習,焚き火,釣り,映画鑑賞

掲載日:2023/10/16

情報処理学会誌2023年11月号

掲載日:2023/03/15

電子情報通信学会2023年総合大会プログラム広告

掲載日:2022/03/01

「日本音響学会 2022年春季研究発表会 講演論文集」広告

掲載日:2021/12/27

「日本音響学会誌」2022年1月号広告

掲載日:2021/08/26

日本音響学会 2021年秋季研究発表会講演論文集広告

掲載日:2021/07/01

「電子情報通信学会誌」2021年7月号広告

掲載日:2021/05/06

「電子情報通信学会誌」2021年5月号広告

掲載日:2021/04/15

情報処理学会誌「情報処理」2021年5月号広告

掲載日:2021/04/08

「数学セミナー」2021年5月号広告

掲載日:2021/03/01

日本音響学会 2021年春季研究発表会 講演論文集広告



6章「音響エフェクト」では,機械学習による音質変換とは異なり,物理モデルに基づく基本的手法を押さえている点も本書の特徴です。


★特設サイトはこちらから★

シリーズ刊行のことば,シリーズラインアップ,著者一覧,目次がご覧いただけます

https://www.coronasha.co.jp/nextspiseries/