レビュー,書籍紹介・書評掲載情報
- 発行年月日
- 2018/04/27
- 定価
- 2,750円(本体2,500円+税)
- ISBN
- 978-4-339-00902-6
レビュー,書籍紹介・書評掲載情報
-
書籍レビュー(@hiro5585様)
掲載日:2018/05/08
Qiitaに詳細を掲載しています。
https://qiita.com/hiro5585/items/01cc0062a101a4f198b1
この書籍は,大きく以下のような特徴があります。
1. Pythonを通じて画像処理・音声処理の基礎を習得できる
2. 画像処理・音声処理を題材としてPythonの数値計算の基礎を習得できる
3. 機械学習のためのハンドクラフト特徴の作り方の基礎を習得できる
内容としては,データ構造など基礎的なことから説明されてあり,そもそも信号がどう表現されていて,プログラム上でどのように扱われているかを最初に説明されていることがよかったです。そして,信号処理の定番であるフーリエ変換について,スペクトルが捉えるものがどういった現象かを,Matplotlibでの可視化結果を踏まえて説明しているのがよかったです。この部分なんとなく使っている人が多い気がするので,再確認する意味でも読むことをおすすめします。最後に応用例として,画像にける画素の分類であったり,音のあるフレームを抽出などが書かれています。
総評すると,信号処理の初学者が一人立ちして研究・開発を行うための入門書としては非常に優れていると思います。また,NumpyやMatplotlibなどの,データ分析では必須となっているライブラリの使い方を実践を伴い学べるのは非常に良いです。
-
読者モニターレビュー【msageha様(修士課程 学生,専門:コンピュータサイエンス,自然言語処理)】
掲載日:2018/04/18
本書籍は,画像や音声といったデジタルメディアを処理するための基礎知識を学ぶための書籍です。
Pythonによるコードが書かれており,実際に手元で動かしながら学べる実践的な内容となっております。
音声処理では,簡単な時系列波形データの扱いから始まり,フーリエ変換,フィルタ処理,複素信号処理といった音声処理を行う上では欠かせない基礎技術を一通り学ぶことができます。
画像処理では,読み込み,抽出といった簡単な画像データの扱いから始まり,2次元フーリエ変換による周波数処理,畳み込み演算による空間領域処理,画像の幾何学的処理といった画像処理に対する基礎技術を体系的に学べます。
大学で学んだ数学的知識が画像・音声処理を通じてどのように役に立つのか知ることで理解が深まるほか,コンピュータによる音声・画像の両データに対する加工,分析,生成方法学ぶことで,音声処理と画像処理の共通性を意識しながら学ぶことが出来る構成になっております。
画像処理・音声処理に興味がある人やこれから研究や業務で携わる人が最初に読んでおくと,その後,より専門的な書籍や論文にあたる際に手助けになると思います。
-
読者モニターレビュー【Y様(博士後期課程 学生,専門:信号処理)】
掲載日:2018/04/17
本書は,Python初心者レベルの読者が音声・画像信号処理の基本技術を学習することを想定して書かれています。数式は必要最低限ながらもサンプルプログラムが充実した構成となっているため,読者はどんどん手を動かして知識を深めることができます。
本書の特徴は,音声と画像のトピックが交互に展開されているところで,両メディアの信号処理に共通する基礎が段階的に習得できる点です。最終章では,楽器音合成や画像解析といった応用例も紹介されており,信号処理全般やPythonプログラミングに興味を持つ読者にとって非常に良い入門本だと思います。
-
読者モニターレビュー【kouki様(研究職,専門:信号処理)】
掲載日:2018/04/16
本書は,音声信号や画像情報をPythonで処理するための基礎から丁寧に説明してくれます。
対象者は,ちょうど大学の研究室に配属された人や,仕事で音声・画像処理を始めることになった人でしょうか。
Pythonについては,numpyやmatplotlibなど基本的なライブラリのみを使っているので,Python初心者でもはじめやすいでしょう。
ただし,本書の中ではPythonの環境構築周りの説明は省略されており,Pythonをゼロから始める人は別の書籍も用意したほうが良いと思います(ちなみに、サポートページには環境構築手順があります)。
構成は,まず音の基礎(波形の生成)からmatplotlibによる可視化でnumpy配列の基本を押さえます。
その後,画像の読み込み・描画,音のフーリエ変換から画像の周波数処理と,音と画像の処理が交互に説明されています。
これが読む前は「音と画像分けたほうが良いのでは?」と思いましたが,ちょうど1次元信号の処理から2次元へのステップアップになっていて,結果わかりやすい説明になっていました。
後半,音についてはWavetable合成について説明されています。Wavetable合成という言葉は聞き慣れなかったのですが,要はディジタルシンセサイザーで用いられる音声合成方法です。
ここは音楽音響(ピアノなどの楽器音をコンピュータで合成するなど)の範囲になるので,一般的な機械学習の書籍で取り上げられているのは珍しいかと思います。
画像は,K-means法による画像領域のクラスタリングを行っており,これは機械学習の定番をしっかり押させてるなと思います。
後半の応用部分は多少物足りなさを感じるかもしれませんが,そこにたどり着くまでの基礎を丁寧に学べる良い本だと思いました。