MATLABで学ぶ実践画像・音声処理入門

MATLABで学ぶ実践画像・音声処理入門

サンプルデータを活用しながら,MATLABによる画像・音声処理技術を実践的に習得できる構成となっており,例題も多数掲載した。

ジャンル
発行年月日
2019/09/30
判型
A5
ページ数
200ページ
ISBN
978-4-339-00925-5
MATLABで学ぶ実践画像・音声処理入門
在庫あり

定価

2,860(本体2,600円+税)

カートに入れる

購入案内

  • 内容紹介
  • まえがき
  • 目次
  • 著者紹介
  • 広告掲載情報

本書は,サンプルデータを活用しながら,領域の抽出や音声波形の重ね合わせなど,MATLABによる画像・音声処理の基本的な技術を実践的に習得できる構成となっており,例題も多数掲載した(前著にPython版もあり)。

音声や画像は,コンピュータ処理の対象となって,メディアとしての可能性が飛躍的に広がりました。そのようなディジタル処理技術の多くは,数学に基づいています。また,音声や画像は物理的な現象なので,物理モデルも多用されます。物理モデルの多くも数式に基づいています。MATLABは,それらの処理を,ほぼ数式をそのまま記述するのと同様の形式でプログラミングできます。そのため,論文など専門文書で数式に基づいて紹介される手法を直接試すのに便利です。本書では,そういった手法を身につけるための基本的な手法を簡単な数式に基づく処理のプログラムとして取り上げています。これらのプログラムで,実際の音声データや画像データを処理しながら学ぶことを目的としています。コンピュータによる音声や画像の簡単な加工,分析,生成方法を,音声処理と画像処理の共通性を意識しながら学べるような内容にしました。


対象読者
本書では,数式に基づく手法の説明に集中するため,MATLABのプログラミング言語としての文法や使い方などは,必要最低限しか取り上げません。幸い,プログラミング言語としてのMATLABの使い方については,MathWorks社のMATLABトレーニングのページ(https://matlabacademy.mathworks.com/jp)にある無料コースの「MATLAB入門」が優れています。本書では,このコースを修了していることを想定しています。数学に関しては,高校数学および大学レベルの微積分,線形代数,統計学の基礎知識があることを想定しています。またフーリエ変換については,どのようなものか知っている方がサンプルプログラムを理解しやすいでしょう。数学に関しては,必要に応じて,これらのレベルの基礎的な教科書を参照すれば十分でしょう。


本書の構成
本書では,説明内容に合わせて,数行のプログラムが示されます。これらのプログラムは,章内では,全部続けて実行することを想定しています。つまり,章の最初の方で値を設定された変数が,後のプログラムで断りなしに使われることもあります。また,章の最初にキーワードを示します。それに関連する数学的な事項を思い出すとよいでしょう。その章で学んだことを定着させるための章末問題も用意しています。これらの問題は,学んだ知識を自分なりに応用するためのヒントになっています。定着させるためには,最後まで自力で考えた方がよいのですが,巻末にはヒントを掲載しました。


本書で想定するMATLAB環境
本書のサンプルプログラムは,Windows10上のMATLAB 2019aの環境で動作確認しています。MacやLinuxなど異なる環境では,出力などが多少異なることもありうるのでご留意ください。本書で用いた音声や画像データ,本書のために開発したパッケージも本ページからダウンロードできます。

本書では,MATLAB本体以外につぎのToolboxを用います。Image Processing Toolbox(2,5,6,10~12章),Signal Processing Toolbox(3~5,7~9,12章),Statistics and Machine Learning Toolbox(6,7,11,12 章)。科学技術プログラミングの分野では,MATLABと同様な用途で,PythonのNumPyなどのモジュールが使われます。拙著『Pythonで学ぶ実践画像・音声処理入門』(2018年,コロナ社刊)は本書とほぼ同じ内容となっているので,PythonのプログラムをMATLAB に移植したり,その逆の用途にも役立つと思います。これらの書籍が,音声・画像処理の実践的なプログラミングを習得する一歩になれば幸いです。
2019年7月 著者

1. 簡単な音声処理
1.1 波形データの生成
1.2 1次元データの可視化
1.3 時間波形の重ね合わせ
1.4 時間波形の連結
1.5 読み込んだ音声データの加工
章末問題

2. 簡単な画像処理
2.1 画像の構造
2.2 画像・ビデオの読み込み
2.3 領域の抽出
章末問題

3. 音声のフーリエ変換
3.1 周期現象
3.2 フーリエ変換
3.3 窓関数
3.4 実データのスペクトル解析
3.5 スペクトログラム
3.6 逆フーリエ変換
章末問題

4. フィルタ(音声)
4.1 線形フィルタ
 4.1.1 線形システム
 4.1.2 遅延演算
 4.1.3 移動平均フィルタ
4.2 インパルス応答
4.3 IIRフィルタ
4.4 フィルタ設計のツール
章末問題

5. 画像の周波数領域処理
5.1 空間周波数
5.2 2次元フーリエ変換
5.3 周波数領域でのフィルタ処理
5.4 周波数領域での画像の拡大
章末問題

6. 画像の空間領域処理
6.1 2次元畳み込み
6.2 微分演算
6.3 エッジの検出
6.4 非線形フィルタ
章末問題

7. 音声データの相関
7.1 相互相関
 7.1.1 ベクトルの類似度
 7.1.2 相互相関関数
7.2 自己相関
7.3 時間波形のフレーム処理
章末問題

8. 画像データの類似度
8.1 画素のユークリッド距離
8.2 画素の相関の応用
8.3 領域の相関
章末問題

9. 複素信号
9.1 信号の複素指数関数表現
9.2 周波数変調
 9.2.1 瞬時周波数
 9.2.2 周波数変調
 9.2.3 任意の音の周波数変調
章末問題

10. 画像の幾何学的処理
10.1 2次元平面上の回転
10.2 2次元平面上の平行移動
10.3 同次座標表現を用いた変換
10.4 アフィン変換
10.5 射影変換
10.6 複雑な形状の変換
章末問題

11. 分類
11.1 特徴量
 11.1.1 短時間エネルギー
 11.1.2 零交差
11.2 k最近傍分類
11.3 最尤法
章末問題

12. 音声・画像処理の応用
12.1 Wavetable合成
 12.1.1 ADSRエンベロープ
 12.1.2 楽器音からの波形データの抽出
 12.1.3 複数のテンプレートを用いた合成
 12.1.4 長さの変更
 12.1.5 リサンプルによるピッチの変更
12.2 衛星画像の時間変化領域の解析
章末問題

章末問題ヒント
索引

小泉 悠馬(コイズミ ユウマ)

掲載日:2020/03/04

日本音響学会 2020年春季研究発表会 講演論文集広告

掲載日:2019/11/05

日刊工業新聞広告掲載(10月31日)

掲載日:2019/10/01

電子情報通信学会誌2019年10月号広告

https://matlabacademy.mathworks.com/jp

関連資料(一般)

関連資料一覧