書名で キーワードで

詳細検索 >>

HOME  > 電気・電子工学  / 信号処理  / ディジタル信号処理  > Pythonで学ぶ実践画像・音声処理入門

書籍詳細

  Pythonで学ぶ実践画像・音声処理入門

▼ 目次を読む

▼ 目次をたたむ

伊藤克亘 法政大教授 博士(工学) 著

花泉弘 法政大教授 工博 著

小泉悠馬 NTTメディアインテリジェンス研究所 博士(工学) 著

… 著者ホームページです

発行年月日:2018/04/27 , 判 型: A5,  ページ数:190頁

ISBN:978-4-339-00902-6,  定 価:2,700円 (本体2,500円+税)

本書は,ディジタルメディアの代表的データである画像や音声をコンピュータで扱うための基本的な手法を知り,実際に読者がPythonを用いて様々な処理ができるようになることを目標としている。

本書で使用したパッケージや音声・画像データ,章末問題の解答例を掲載しています。

【目次】

1. 簡単な音声処理
1.1 波形データの生成
1.2 1次元データの可視化
1.3 時間波形の重ね合わせ
1.4 時間波形の連結
1. 簡単な音声処理
1.1 波形データの生成
1.2 1次元データの可視化
1.3 時間波形の重ね合わせ
1.4 時間波形の連結
1.5 読み込んだ音声データの加工
章末問題

2. 簡単な画像処理
2.1 画像の構造
2.2 画像・ビデオの読み込み
2.3 領域の抽出
章末問題

3. 音声のフーリエ変換
3.1 フーリエ変換
3.2 窓関数
3.3 音声のフレーム処理
3.4 逆フーリエ変換
章末問題

4. フィルタ(音声)
4.1 線形フィルタ
 4.1.1 線形システム
 4.1.2 遅延演算
 4.1.3 移動平均フィルタ
4.2 インパルス応答
4.3 IIRフィルタ
4.4 フィルタ設計のツール
章末問題

5. 画像の周波数領域処理
5.1 空間周波数
5.2 2次元フーリエ変換
5.3 周波数領域でのフィルタ処理
5.4 周波数領域での画像の拡大
章末問題

6. 画像の空間領域処理
6.1 2次元畳み込み
6.2 微分演算
6.3 エッジの検出
6.4 非線形フィルタ
章末問題

7. 音声データの相関
7.1 相互相関
 7.1.1 ベクトルの類似度
 7.1.2 相互相関関数
7.2 自己相関
7.3 時間波形のフレーム処理
章末問題

8. 画像データの類似度
8.1 画素のユークリッド距離
8.2 画素の相関の応用
8.3 領域の相関
章末問題

9. 複素信号
9.1 信号の複素指数関数表現
9.2 周波数変調
 9.2.1 瞬時周波数
 9.2.2 周波数変調
 9.2.3 任意の音の周波数変調
章末問題

10. 画像の幾何学的処理
10.1 2次元平面上の回転
10.2 2次元平面上の平行移動
10.3 同次座標表現を用いた変換
10.4 アフィン変換
10.5 射影変換
10.6 複雑な形状の変換
章末問題

11. 分類
11.1 特徴量
 11.1.1 短時間エネルギー
 11.1.2 零交差
11.2 k最近傍分類
11.3 最尤法
章末問題

12. 音声・画像処理の応用
12.1 Wavetable合成
 12.1.1 ADSRエンベロープ
 12.1.2 楽器音からの波形データの抽出
 12.1.3 複数のテンプレートを用いた合成
 12.1.4 長さの変更
 12.1.5 リサンプルによるピッチの変更
12.2 衛星画像の時間変化領域の解析
章末問題

章末問題ヒント
索引

【関連情報】

【おすすめ本】

【レビュー】

読者モニターレビュー①
【msageha様(修士課程 学生,専門:コンピュータサイエンス,自然言語処理)】

 本書籍は,画像や音声といったデジタルメディアを処理するための基礎知識を学ぶための書籍です。
 Pythonによるコードが書かれており,実際に手元で動かしながら学べる実践的な内容となっております。
 音声処理では,簡単な時系列波形データの扱いから始まり,フーリエ変換,フィルタ処理,複素信号処理といった音声処理を行う上では欠かせない基礎技術を一通り学ぶことができます。
 画像処理では,読み込み,抽出といった簡単な画像データの扱いから始まり,2次元フーリエ変換による周波数処理,畳み込み演算による空間領域処理,画像の幾何学的処理といった画像処理に対する基礎技術を体系的に学べます。
 大学で学んだ数学的知識が画像・音声処理を通じてどのように役に立つのか知ることで理解が深まるほか,コンピュータによる音声・画像の両データに対する加工,分析,生成方法学ぶことで,音声処理と画像処理の共通性を意識しながら学ぶことが出来る構成になっております。
 画像処理・音声処理に興味がある人やこれから研究や業務で携わる人が最初に読んでおくと,その後,より専門的な書籍や論文にあたる際に手助けになると思います。




読者モニターレビュー②
【Y様(博士後期課程 学生,専門:信号処理)】

 本書は,Python初心者レベルの読者が音声・画像信号処理の基本技術を学習することを想定して書かれています。数式は必要最低限ながらもサンプルプログラムが充実した構成となっているため,読者はどんどん手を動かして知識を深めることができます。
 本書の特徴は,音声と画像のトピックが交互に展開されているところで,両メディアの信号処理に共通する基礎が段階的に習得できる点です。最終章では,楽器音合成や画像解析といった応用例も紹介されており,信号処理全般やPythonプログラミングに興味を持つ読者にとって非常に良い入門本だと思います。

在庫は時期によりまして変動することがございますので、ご了承ください。