音声音響信号処理の基礎と実践 - フィルタ,ノイズ除去,音響エフェクトの原理 -

次世代信号情報処理シリーズ 2

音声音響信号処理の基礎と実践 - フィルタ,ノイズ除去,音響エフェクトの原理 -

  • 田中 聡久 東京農工大教授 博士(工学) 監修
  • 川村 新 京都産業大教授 博士(工学)

音声・音響に関する信号処理技術を,現場ですぐに活用できる形で,かつ平易に解説する。

ジャンル
発行年月日
2021/04/30
判型
A5
ページ数
220ページ
ISBN
978-4-339-01402-0
音声音響信号処理の基礎と実践 - フィルタ,ノイズ除去,音響エフェクトの原理 -
在庫あり

定価

3,630(本体3,300円+税)

カートに入れる

電子版を購入

購入案内

  • 内容紹介
  • まえがき
  • 目次
  • レビュー
  • 著者紹介
  • 広告掲載情報

信号処理の講義は,座学が中心であることに加え,信号処理の応用範囲が,音声,画像,電波など多岐にわたるため,信号処理の基礎理論と応用技術の関連性を受講者がイメージしにくい面がある。このような背景から,応用をイメージした信号処理の学習ができれば効果的であるという考えのもと,本書では音声・音響に焦点を絞り,信号処理の基礎理論と応用技術について,読者ができるだけ現場ですぐに活用できる形で,かつ平易に解説することを心がけて,以下の構成で執筆した。
1章では,音を題材として信号処理技術の基礎を復習する。最初に,ディジタルフィルタの基礎を解説し,低域通過フィルタ,高域通過フィルタ,帯域通過フィルタ,ノッチフィルタの設計方法を述べる。つぎに,ディジタル信号を分析する際に不可欠となる,離散フーリエ変換などの信号変換技術について解説する。さらに,音の信号処理で,頻繁に利用される窓関数とオーバラップ加算について説明する。
2章では,音声の発声原理について述べ,簡単な発声モデルとして音声の分析,合成に有用なソース・フィルタモデルを説明する。さらに,ソース・フィルタモデルを利用した,線形予測分とケプストラム分析について解説する。
3章では,音の周波数成分の時間的な変化を,視覚的に確認することができるスペクトログラムのつくり方について述べる。また,スペクトログラムの応用技術として,画像から音を生成する方法と,その適切な位相スペクトルの生成法,そして,音で任意のスペクトログラムを描画する方法について述べる。
4章では,STFT(短時間フーリエ変換)を用いた周波数分析に基づき,不要な信号を除去する方法について述べる。最初に,マイクロホンを一つとし,統計的性質が変化しないノイズを,音声から除去する方法を説明する。最も単純な方法として,スペクトル減算法を説明し,ついで,ウィーナーフィルタ,MAP(事後確率最大化)推定法について述べる。つぎに,マイクロホンを二つ用いて,二つの音声を分離する方法を説明する。ここでは,バイナリマスキングと呼ばれる単純な手法により,音源のスペクトルを分離する。
5章では,システム同定を題材として,適応アルゴリズムを導出する。さらに,適応フィルタのノイズ除去への応用について説明する。
6章では,エコーをはじめとする各種音響エフェクトの原理と実現方法について述べる。ここで取り上げた音響エフェクトの多くは,リアルタイム処理が可能である。それぞれ比較的簡単な処理で実現できるが,その原理について,理解しておくことは重要である。原理を理解しておけば,自在にアレンジできるので,音楽制作や,ボイスチェンジャなど,応用範囲が格段に広がる。

【読者へのメッセージ】
信号処理に苦手意識がある学生や,音の加工技術についてより深く学びたい技術者の方に向けて,音声・音響に焦点を当てた信号処理の解説書を執筆しました。実用的なフィルタや音の加工技術について,できるだけ平易に,かつすぐに利用できる形でまとめています。本書を通して,音の信号処理,引いては信号処理全般の知識を深め,仕事や趣味に役立てていただけることを願っています。

大学講義の信号処理においては,座学が中心であることに加え,信号処理の応用範囲が,音声,画像,電波など多岐にわたるため,信号処理の基礎理論と応用技術の関連性がイメージしにくい。当然ながら,教科書も汎用性の高い書き方となり,基礎理論を中心に解説される。さまざまな分野に応用できることは述べられているものの,具体的な応用例の提示が限られてしまうことは避けられない。

企業などの開発現場で活躍される方々は,セミナーなどに参加して,大学で学んだはずの信号処理を改めて勉強している。しかし,日々の業務に追われる中で,基礎からの再学習には限界があるのも事実である。そこで,大学生,あるいは信号処理技術を必要とする初学者向けに,応用をイメージした信号処理の学習ができれば効果的であると考えた。本書では,応用技術の中でも,音声・音響に焦点を絞り,信号処理の基礎と応用を解説する。

耳は,目や口と違って閉じることができない。我々人間は,眠っていても,外部の音を鼓膜の振動を通して感じとっている。はるか昔から,人間は音声を発し,それを聞くことで他者との意思疎通をはかり,また,雷鳴や獣の声を聞くことで危険を察知し,回避してきた。話や音楽を聴いてリラックスする,感動する,気分を盛り上げる。耳はたえず働いていて,たった二つの鼓膜の振動だけで,音源の方向や位置の特定,雑音に埋もれた音の抽出,複数の音の選別,さらには人の感情や状態を知ることまでできる。このように,耳,あるいは聴覚は,音を日常的に分析している。

一方,最近の信号処理技術の発展により,音の分析・加工技術が進化してきた。この恩恵を受け,音を人間にとって有益な信号に変換することが,比較的容易にできるようになった。信号処理と音との親和性は高く,信号処理から音を理解する,あるいは逆に,音から信号処理を理解することは有益である。

本書は,音声・音響に関する信号処理技術を,できるだけ現場ですぐに活用できる形で,かつ平易に解説することを心がけて執筆した。しかしながら,筆者はまだまだ未熟,浅学であるため,ごく限られた技術しか扱うことはできず,その解説も拙い部分が多々あることと思われる。ぜひ読者や先輩諸兄からのご指導,ご鞭撻を頂戴したい。一方で,本書が,音声・音響の信号処理技術者にとって,少しでも有益なものとなるならば,筆者にとって最大の喜びである。

2021年2月
川村 新

1.音で復習する信号処理の基礎
1.1 ディジタル信号とフィルタ
 1.1.1 ディジタル信号
 1.1.2 確率信号の記述について
 1.1.3 ディジタルフィルタ
 1.1.4 フィルタの構成要素
 1.1.5 FIRフィルタとIIRフィルタ
 1.1.6 FIRフィルタのインパルス応答
1.2 FIRフィルタの設計
 1.2.1 直線位相FIRフィルタの設計
 1.2.2 低域通過フィルタ(LPF)の設計
 1.2.3 高域通過フィルタ(HPF)の設計
 1.2.4 帯域通過フィルタ(BPF)の設計
1.3 ノッチフィルタの設計
 1.3.1 IIRフィルタのインパルス応答
 1.3.2 IIRフィルタとFIRフィルタの接続
 1.3.3 オールパスフィルタ
 1.3.4 ノッチフィルタ
1.4 離散フーリエ変換
 1.4.1 z変換
 1.4.2 フィルタとz変換の関係
 1.4.3 離散時間フーリエ変換
 1.4.4 離散フーリエ変換
1.5 窓関数
 1.5.1 矩形窓
 1.5.2 ハン窓
 1.5.3 その他の窓関数
1.6 STFTとオーバラップ加算
 1.6.1 ハーフオーバラップ
 1.6.2 STFTの冗長性
 1.6.3 位相スペクトルの復元

2.発声モデル
2.1 ソース・フィルタモデル
 2.1.1 音声の発声の仕組み
 2.1.2 音源と声道フィルタ
 2.1.3 音声のソース・フィルタモデル
 2.1.4 微細構造とスペクトル包絡
 2.1.5 基本周期と基本周波数
2.2 線形予測分析
 2.2.1 予測誤差フィルタ
 2.2.2 音声の合成
 2.2.3 レビンソン・ダービンアルゴリズム
 2.2.4 フォルマント
2.3 ケプストラム分析
 2.3.1 ケプストラム
 2.3.2 スペクトル包絡

3.スペクトログラム
3.1 スペクトログラムの生成
 3.1.1 オーバラップとスペクトログラム
 3.1.2 スペクトログラムの行列表現
3.2 スペクトログラムからの音合成
 3.2.1 位相スペクトルによる合成音の違い
 3.2.2 反復位相復元
3.3 画像の音変換
 3.3.1 画像音響変換
 3.3.2 画像からの合成音生成
 3.3.3 合成音のスペクトログラム
 3.3.4 オーバラップを含む場合の合成音
 3.3.5 ISTFT以外でつくる画像の音
3.4 音で画像を描く
 3.4.1 垂直線の描画
 3.4.2 水平線の描画
 3.4.3 点の描画

4.周波数分析に基づくノイズ除去
4.1 単一マイクロホンによるノイズ除去システム
 4.1.1 スペクトルゲインによるノイズ除去
 4.1.2 スペクトル減算法
 4.1.3 ウィーナーフィルタ
 4.1.4 判定指向法
4.2 事後確率最大化によるノイズ除去
 4.2.1 事後確率
 4.2.2 MAP推定法
 4.2.3 MAP推定によるウィーナーフィルタの導出
 4.2.4 その他のMAP推定によるスペクトルゲイン
 4.2.5 ノイズ除去結果の比較
4.3 音源の分離
 4.3.1 音源位置と観測信号の関係
 4.3.2 会話音声の性質
 4.3.3 バイナリマスキング

5. 適応フィルタ
5.1 システム同定
 5.1.1 システム同定の構成
 5.1.2 評価関数の設定
 5.1.3 フィルタ係数の最適値
 5.1.4 適応アルゴリズム
 5.1.5 最急降下法
 5.1.6 LMSアルゴリズム
 5.1.7 NLMSアルゴリズム
5.2 フィードバックキャンセラ
 5.2.1 音のループが生じる環境
 5.2.2 エコーキャンセラ
 5.2.3 フィードバックキャンセラ
5.3 適応線スペクトル強調器
 5.3.1 適応線スペクトル強調器の原理
 5.3.2 ALEによる音声の白色雑音除去
 5.3.3 ALEによる音声の正弦波ノイズ除去
5.4 突発ノイズ除去
 5.4.1 正弦波に対する線形予測
 5.4.2 線形予測器による正弦波信号の補間
 5.4.3 音声の突発ノイズ除去

6.音響エフェクト
6.1 エコー
 6.1.1 エコーの定式化
 6.1.2 ディレイ
 6.1.3 リバーブ
6.2 正弦波の乗算によるボイスチェンジャ
 6.2.1 正弦波の乗算
 6.2.2 正弦波乗算の効果
 6.2.3 折り返し歪みの影響
 6.2.4 音声に正弦波を乗じた結果
6.3 リングバッファによるボイスチェンジャ
 6.3.1 リングバッファ
 6.3.2 音の高さの変更
 6.3.3 音声に対するリングバッファの長さ
 6.3.4 リングバッファによるボイスチェンジャ
 6.3.5 リングバッファの不連続性を回避する方法
 6.3.6 不連続性を回避したボイスチェンジャの実現
6.4 話速変換とピッチシフタ
 6.4.1 リサンプリング
 6.4.2 もとの信号とリサンプリング後の信号の対応関係
 6.4.3 ディジタル信号から連続時間信号への変換
 6.4.4 リサンプリングの実現
 6.4.5 音声の周期を利用した話速変換
 6.4.6 話速を速くする方法
 6.4.7 話速を遅くする方法
 6.4.8 ピッチシフタ
6.5 ヘリウムボイス
 6.5.1 音速と波長
 6.5.2 声道の共鳴周波数と音速の関係
 6.5.3 スペクトル包絡の伸縮
 6.5.4 ヘリウムボイスの実現
6.6 コンプレッサ
 6.6.1 コンプレッサの基本構成
 6.6.2 ガンマ変換によるコンプレッサ
 6.6.3 ノイズゲート
 6.6.4 ディストーション
6.7 その他の音響エフェクト
 6.7.1 トレモロ
 6.7.2 ビブラート
 6.7.3 コーラス

引用・参考文献
索引

読者モニターレビュー【shinngoushori.com様(ご専門:音楽/音響信号処理)】

音声・音響信号処理を理解するのに必要な内容の説明から入り,徐々に専門的な内容に染まっていきます。ただ読むだけでなく,所々に例題と解答があり,手を動かしながら理解度を確認することができるので,頭がかたくなってきた私にはありがたいです。

本書籍は,信号処理関連の書籍にありがちな難解な数式はほとんどなく,平易に説明してくれています。著者さんの優しさ/ご配慮のおかげで,読みやすさはもちろんのこと,モチベーションの維持,実装のし易さというメリットがあります。

実装といえば,実装に関するヒントも書かれているため,理論よりも実装を重視したい方にもおすすめできます。ある程度のプログラミング経験のある方であれば,MATLABやScilabあるいはPythonなどで,あまり悩まずにコーディングできると思います。

音響信号処理に関する書籍を読んでいると時々,「数学」をやっているのか「音響」をやっているのか分からなくなる時がありますが,豊富な図と分かりやすい数式で「今は音声・音響を勉強している」という気持ちになれる1冊でした。

読者モニターレビュー【あつもり様(ご専門:音・聴覚情報処理)】

この本では,音に特化した信号処理の基礎的な理論が解説がされています。

具体的には信号処理の基本中の基本であるFIR・IIRフィルタや窓関数,STFTといった内容から始まり,線形予測分析・ケプストラム分析といった発声モデル(2章),ノイズ除去(4・5章)のような音響分野における主要な信号処理の理論に展開されていきます。

文系出身の自分には,信号処理の本はまだ敷居が高いなという不安もありましたが,この本に出てくる数式は,簡潔で分かりやすい図や解説のおかげで非常に追いやすく,ワクワクしながら読み進めることができました。

また,適宜挟まれる例題も丁度良い難易度で,理解を深めてくれました。

この本は,音響・音声に特化した内容で信号処理の理論をしっかりと学べる,ありそうであまりなかった一石二鳥の素晴らしい本だと思います。

音の信号処理を扱いたい方には,かなり参考になるのではないでしょうか。

田中 聡久(タナカ トシヒサ)

川村 新

川村 新(カワムラ アラタ)

【略歴】
1990年~1995年 鳥取大学工学部電気電子工学科
1995年~1999年 ABB株式会社 勤務
1999年~2001年 鳥取大学大学院工学研究科博士前期課程
2001年~2003年 鳥取大学大学院工学研究科博士後期課程
2003年~2018年 大阪大学基礎工学部 勤務
2018年~現在 京都産業大学情報理工学部 勤務
【趣味】
ハンドフルートの練習,焚き火,釣り,映画鑑賞

掲載日:2021/04/15

情報処理学会誌「情報処理」2021年5月号広告

掲載日:2021/04/08

「数学セミナー」2021年5月号広告

掲載日:2021/03/01

日本音響学会 2021年春季研究発表会 講演論文集広告



6章「音響エフェクト」では,機械学習による音質変換とは異なり,物理モデルに基づく基本的手法を押さえている点も本書の特徴です。





『次世代信号情報処理シリーズ』ラインナップ
  1. 信号・データ処理のための行列とベクトル- 複素数,線形代数,統計学の基礎 -
  2. 田中聡久 著 
  3. 音声音響信号処理の基礎と実践- フィルタ,ノイズ除去,音響エフェクトの原理 -
  4. 川村 新 著 

以下続刊
  • 線形システム同定の基礎―最小二乗推定と正則化の原理―
  • 藤本悠介・永原正章 著 
  • ブレイン・マシン・インタフェースと信号処理
  • 東 広志・中西正樹・田中聡久 共著 
  • 通信のための信号処理
  • 林 和則 著 
  • グラフ信号処理- 基礎から応用まで -
  • 田中雄一 著 
  • 画像・音メディア処理のための深層学習- 信号処理から見た解釈 -
  • 高道慎之介・小泉悠馬・齋藤真樹 著 
  • 多次元信号・画像処理の基礎と展開
  • 村松正吾 著 
  • 適応信号処理
  • 湯川正裕 著 
  • コンピュータビジョン時代の画像復元
  • 宮田高道・小野峻佑・松岡 諒 共著 
  • 生体情報の信号処理と解析- 脳波・眼電図・筋電図・心電図 -
  • 小野弓絵 著 
  • 高能率映像情報符号化の信号処理- 映像情報の特徴抽出と効率的表現 -
  • 坂東幸浩 著 
  • Python信号処理
  • 奥田正浩・京地清介・杉本憲治郎 共著 
  • HDR信号処理
  • 奥田正浩 著 
  • 音源分離のための音響信号処理
  • 小野順貴 著 
  • 凸最適化とスパース信号処理
  • 小野峻佑 著 

刊行のことば

 信号処理は,音声,音響,画像,電波など,連続する数値や連続波形が意味を持つデータを加工する技術です。現代のICT社会・スマート社会は信号処理なしには成り立ちません。スマートフォンやタブレットなどの情報端末はコンピュータ技術と信号処理技術が見事に融合した例ですが,私たちがその存在を意識することがないほど,身の回りに浸透しています。さらには,応用数学や最適化,また統計学を基礎とする機械学習などのさまざまな分野と融合しながらさらに発展しつつあります。

 もともと信号処理は回路理論から派生した電気電子工学の一分野でした。抵抗,コンデンサ,コイルを組み合わせると,特定の周波数成分を抑制できるアナログフィルタを構成できます。アナログフィルタ技術は電子回路と融合することで能動フィルタを生み出しました。そしてディジタル回路の発明とともに,フィルタもディジタル化されました。一度サンプリングすれば,任意のフィルタをソフトウェアで構成できるようになったのです。ここに「ディジタル信号処理」が誕生しました。そして,高速フーリエ変換の発明によって,ディジタル信号処理は加速度的に発展・普及することになったのです。

 ディジタル技術によって,信号処理は単なる電気電子工学の一分野ではなく,さまざまな工学・科学と融合する境界分野に成長し始めました。フィルタのソフトウェア化は,環境やデータに柔軟に適応できる適応フィルタを生み出しました。信号はバッファリングできるようになり,画像信号はバッチ処理が可能になりました。そして,線形代数学や統計学を柔軟に応用することで,テレビやカメラに革命をもたらしました。もともと周波数解析を基とする音声処理技術は,ビッグデータをいち早く取り込み,人工知能の基盤技術となっています。電波伝送の一分野だった通信工学は,通信のディジタル化によって信号処理技術なしには成り立たないうえ,現代のスマート社会を支えるインフラとなっています。このように,枚挙に暇がないほど,信号処理技術は社会における各方面での基盤となっているだけでなく,さまざまな周辺技術と柔軟に融合し新たなテクノロジーを生み出しつつあります。

 また,現代テクノロジーのコアたる信号処理は,電気・情報系における大学カリキュラムでは必要不可欠な科目となっています。しかしながら,大学における信号処理教育はディジタルフィルタの設計に留まり,高度に深化した現代信号処理からはほど遠い内容となっています。一方で,最新の信号処理技術,またその周辺技術を知るには,論文を読んだり,洋書にあたったりする必要があります。さらに,高度に抽象化した現代信号処理は,ときに高等数学をバックグラウンドにしており,技術者は難解な数学を学ぶ必要があります。以上のことが本分野へ参入する壁を高くしているといえましょう。

 これがまさに,次世代信号情報処理シリーズ“Next SIP”を刊行するに至ったきっかけです。本シリーズは,従来の伝統的な信号処理の専門書と,先端技術に必要な専門知識の間のギャップを埋めることを目的とし,信号処理分野で先端を走る若手・中堅研究者を執筆陣に揃えています。本シリーズによって,より多くの学生・技術者に信号処理の面白みが伝わり,さらには日本から世界を変えるイノベーションが生まれる助けになれば存外の喜びです。

2019年6月

次世代信号情報処理シリーズ監修 田中聡久