画像処理と画像認識 - AI時代の画像処理入門 -

山田宏尚岐阜大教授工博著
末松良一名大名誉教授・愛知工大客員教授工博著

「画像処理工学（改訂版）」（メカトロニクス教科書シリーズ）に新しいトピックを加え新装

ジャンル

発行年月日: 2022/10/26

判型: B5

ページ数: 206ページ

ISBN: 978-4-339-02931-4

在庫あり

2営業日以内に出荷致します。

定価

3,410円(本体3,100円+税)

カートに入れる

購入案内

内容紹介
まえがき
目次
レビュー
著者紹介
広告掲載情報

【書籍の特徴】
本書では，幅広いトピックを入門的に扱いながら，信号処理技術，画像処理手法，画像計測やグラフィックス，さらに機械学習や深層学習を中心に広範な領域となっている画像認識などの分野をバランス良く配分させ，基礎事項を体系的に学べるように，以下の構成とした。また，OpenCVなどのフリーのライブラリや深層学習のフレームワークを用いて画像処理や認識を行う方々にとって必要な「理論的基礎知識」も本書により得られる。

【本書の構成】
1章：「序論」では，人間の視覚機能と画像処理工学の関係について述べ，画像処理技術がわれわれの生活にどのように役立っているかについて述べる。
2章：「画像の表現」では，ディジタル画像の特徴とその表現方法について述べる。
3章：「画像処理システム」では，コンピュータによる画像処理システムや専用ハードウェアの構成および，画像入出力のための機器について述べる。
4章：「画像情報処理」では，画像情報の処理で特に重要となるフーリエ変換等の直交変換についての基礎的事項を取り上げる。また，これらを応用したフィルタ処理や画像データの圧縮についても述べる。
5章：「濃淡画像処理」では，濃淡画像に対してよく用いられるコントラストの改善，ノイズの除去，特徴の抽出，画像の幾何学的形状の変換などの画像処理手法について述べる。
6章：「2値画像処理」では，2値画像を用いる目的と2値化処理の手法について述べる。
7章：「コンピュータグラフィックス」では，2次元および3次元CGにおける基本的なCGの手法について概説する。
8章：「領域分割」では，物体認識や画像合成などに用いられる重要な処理の一つである領域分割の代表的な手法について述べる。
9章：「特徴・パターンの検出」では，まずテンプレートマッチングについて説明した後，パターン認識でよく用いられる図形の形状特徴である局所特徴とその求め方について述べる。
10章：「画像認識」では，概要およびパターンの識別手法について述べる。
11章：「ニューラルネットワークと深層学習」では，まずはニューラルネットワークについて説明し，画像認識が著しい性能向上を果たした大きな要因である深層学習や，畳み込みニューラルネットワークの原理と応用について詳しく述べる。
12章：「3次元画像処理」では，1枚あるいは複数の画像から3次元情報を復元したり，3次元環境の計測や認識を行う方法について述べる。
13章：「動画像処理」では，オプティカルフローの抽出，差分画像を利用する方法などの代表的な手法について述べる
14章：「画像処理の応用」では，画像処理の応用事例について触れ，これまでに述べた画像処理技術が実際にどのように利用されているかについて述べる。

前著『画像処理工学』（メカトロニクス教科書シリーズ）は，画像処理を初歩から学習しようとするさまざまな分野の方を対象として，2000年に出版されました。そして2014年には，その後のディジタル化の流れに対応した改訂を行いました。幸いなことに，前著は多くの大学・高専で教科書として採用され，講義等で使用されてきました。

周知のように，この20年で特に深層学習（ディープラーニング）をはじめとするAI（人工知能）関連の技術が大きく発展し，スマートフォンや自動車の安全運転支援をはじめ，多くの分野で画像処理・認識技術が活用されるようになりました。そして，この分野への期待は以前にも増して高まっているといえます。このような背景を踏まえて，本書ではおもに画像認識に関する内容を大幅に拡充し，新たに『画像処理と画像認識―AI時代の画像処理入門―』として出版することになりました。

画像処理で扱われる領域はたいへん広く，信号処理技術，画像処理手法，画像計測やグラフィックスなどさまざまな分野に及びます。それに加えて画像認識の領域も機械学習や深層学習を中心とした広範な分野があり，学ぶべき項目も膨大になります。このため，既存の教科書では，おかれている重点分野もさまざまに異なっています。そこで本書では，前著と同様に幅広いトピックを入門的に扱いながら，これらの分野をバランス良く配分させ，基礎事項を体系的に学べるように構成しました。

本書を画像処理の教科書として用いる場合は，8章以降は発展的内容あるいは自習用の参考という扱いにされてもよいと思います。また，画像認識やコンピュータビジョンの教科書として用いる場合は，2～7章の基礎的内容を必要に応じてスキップし，8～14章を中心に講義で使うことができるものと思います。

近年，インターネットよりOpenCVなどのフリーのライブラリが簡単に手に入り，初学者でも画像処理や認識のプログラムを実行できるようになりました。また，深層学習を含む最先端の研究ソースも大学や研究機関などにより公開されており，誰もが容易に利用できるようになっています。それらを導入する際に必要な理論的な基礎知識を，本書により得ることができるものと思います。一方で，各項目の本質をわかりやすく説明するために，詳細なアルゴリズムや数学的手法の多くは，あえて省略せざるを得ませんでした。そこで，本書によって基礎的知識を習得後，読者の皆さんがさらに高度な知識を得たい場合には，巻末の引用・参考文献やインターネット上の文献等を参照いただければ幸いです。

本書の執筆にあたっては，多くの文献を参考にさせていただきました。これら著者の方々には心から感謝申し上げます。
最後に，本書を出版するに当たってたいへんお世話になったコロナ社の関係各位に深くお礼を申し上げます。

2022年8月
著者

1．序論
1.1　人間の視覚機能
1.2　画像と画像処理
1.3　ビジョンシステム
1.4　AIと画像処理
演習問題

2．画像の表現
2.1　アナログ画像とディジタル画像
2.2　画像のA―D変換
　2.2.1　標本化
　2.2.2　量子化
2.3　A―D変換と画質との関係
2.4　カラー画像の表現
　2.4.1　人間の視覚とカラー画像
　2.4.2　色の表現法
　2.4.3　カラー画像のディジタル化
2.5　画像データの表現
　2.5.1　画像データの表現方式
　2.5.2　インデックス方式による画像表現
　2.5.3　画像のファイル形式
演習問題

3．画像処理システム
3.1　画像処理システムの構成例
　3.1.1　コンピュータを用いた画像処理システム
　3.1.2　画像処理プログラムにおける高速化のための留意点
　3.1.3　専用ハードウェアによる画像処理装置
3.2　画像の入出力装置
　3.2.1　画像の入力装置
　3.2.2　画像の出力装置
演習問題

4．画像情報処理
4.1　画像のフーリエ変換
　4.1.1　空間周波数
　4.1.2　複素正弦波
　4.1.3　フーリエ変換
　4.1.4　離散フーリエ変換
　4.1.5　高速フーリエ変換
　4.1.6　直交変換
コラム1：直交変換と直交基底
コラム2：直交変換とDFT
　4.1.7　その他の直交変換
4.2　標本化定理
4.3　フィルタ処理
　4.3.1　周波数領域でのフィルタ処理
コラム3：FIRフィルタとIIRフィルタ
　4.3.2　空間領域でのフィルタ処理
コラム4：畳み込みの意味と線形時不変フィルタ
　4.3.3　フィルタの設計
　4.3.4　オペレータによるフィルタ処理
コラム5：局所処理と大局処理
4.4　画像データの圧縮
　4.4.1　可逆符号化
　4.4.2　不可逆符号化
　4.4.3　動画像の符号化
　4.4.4　標準化された符号化技術
コラム6：JPEG非可逆圧縮の特徴
演習問題

5．濃淡画像処理
5.1　濃度変換
　5.1.1　コントラスト変換関数を用いた濃度変換
コラム7：ガンマ補正による濃度変換
　5.1.2　ヒストグラム変換
　5.1.3　隣接する画素との濃度差の強調
5.2　平滑化
　5.2.1　線形フィルタによる平滑化
　5.2.2　エッジを保存した平滑化
5.3　鮮鋭化
コラム8：画像超解像
5.4　エッジ・線の検出
　5.4.1　差分型によるエッジ検出
　5.4.2　零交差法によるエッジ検出
　5.4.3　レンジフィルタ
　5.4.4　Cannyエッジ検出器
5.5　画像表示のための処理
　5.5.1　限定色表示
　5.5.2　疑似濃淡表示
5.6　幾何学的変換
　5.6.1　アフィン変換
　5.6.2　疑似アフィン変換
　5.6.3　画像の再配列と補間
　5.6.4　圧縮された画像データからの拡大・縮小
演習問題

6．2値画像処理
6.1　2値化処理
6.2　連結性と幾何学的性質
　6.2.1　連結と近傍
　6.2.2　幾何学的性質
6.3　2値画像に対する処理
　6.3.1　ラベリング
　6.3.2　膨張・収縮処理
　6.3.3　線・点図形化処理
6.4　図形の形状特徴
演習問題

7．コンピュータグラフィックス
7.12　次元グラフィックス
　7.1.1　線図形の描画
　7.1.2　面の生成と処理
　7.1.3　アンチエリアシング
7.2　3次元グラフィックス
　7.2.13　次元図形の幾何学的変換
　7.2.2　モデリング
　7.2.3　レンダリング
コラム9：CGと画像処理技術の融合
演習問題

8．領域分割
8.1　原画像中のエッジを用いる方法
8.2　領域拡張法
8.3　特徴空間におけるクラスタリングを用いた方法
8.4　テクスチャ解析
8.5　グラフカット法
8.6　深層学習を用いた領域分割
演習問題

9．特徴・パターンの検出
9.1　テンプレートマッチング
9.2　局所特徴
　9.2.1　Harrisのコーナの検出
　9.2.2　FASTによるコーナ検出
　9.2.3　ブロブの検出
　9.2.4　SIFT
　9.2.5　HOG
コラム10：さまざまな記述子
　9.2.6　bag-of-visual words
演習問題

10．画像認識
10.1　画像認識のタスクとプロセス
10.2　ルールベースに基づく画像認識
10.3　統計的パターン認識
　10.3.1　特徴空間
　10.3.2　パターンの識別
コラム11：訓練データの前処理
　10.3.3　クラスタリング
コラム12：遺伝的アルゴリズム
演習問題

11．ニューラルネットワークと深層学習
11.1　ニューラルネットワーク
11.2　深層学習
　11.2.1　活性化関数の改良
　11.2.2　ドロップアウト
　11.2.3　訓練データと学習手順
コラム13：訓練データの作成
　11.2.4　転移学習とファインチューニング
11.3　畳み込みニューラルネットワーク
　11.3.1　畳み込み層
　11.3.2　プーリング層
　11.3.3　出力層
　11.3.4　CNNの応用
コラム14：CNNのネットワークモデル
11.4　オートエンコーダ
11.5　敵対的生成ネットワーク
演習問題

12．3次元画像処理
12.13　次元空間の計測と認識
12.2　1枚の画像を用いた3次元認識
　12.2.1　テクスチャによる方法
　12.2.2　陰影による方法
　12.2.3　その他の方法
12.3　複数の画像を用いた3次元認識
　12.3.1　カメラモデルとキャリブレーション
　12.3.2　ステレオ画像処理
12.4　レンジファインダ
コラム15：3次元データ処理を行うソフトウェア
12.5　3次元形状の復元
演習問題

13．動画像処理
13.1　オプティカルフローの抽出
　13.1.1　照合法
　13.1.2　時空間勾配法
13.2　差分画像を利用する方法
13.3　動画像を用いた行動認識
　13.3.1　従来の機械学習を用いた方法
　13.3.2　深層学習を用いた方法
　13.3.3　RNNとLSTM
13.4　動画像を用いた3次元復元
演習問題

14．画像処理の応用
14.1　産業応用
　14.1.1　組立工程
　14.1.2　検査工程
コラム16：従来の機械学習と深層学習
14.2　医療用画像処理
　14.2.1　CT
　14.2.2　細胞診の自動化
　14.2.3　深層学習による画像診断支援
コラム17：説明可能なAIとネットワークの可視化
14.3　文字認識
　14.3.1　印刷文字認識
　14.3.2　手書き文字認識
　14.3.3　深層学習を用いた文字認識
14.4　顔の認証
コラム18：オープンソースの活用

演習問題
引用・参考文献
演習問題の解答
索引

読者モニターレビュー【泉荘太朗様　早稲田大学（ご専門：心理統計学）】

本書は近年発展著しい画像処理や画像認識の分野の概説書である。

画像処理や画像認識の専門家に向けて精緻な理論を説明するテキストというよりも、むしろこれから画像を扱うタスクに取り組みたいと考える初学者が分野を一望するのに適切なテキストである。非構造データの枠組みで画像分野と肩を並べる分野に言語処理があるが、言語処理についてのテキストから例を挙げると、奥村『自然言語処理の基礎』や黒橋『改訂版自然言語処理』のようなレベル・コンセプトのテキストである。

各章の内容は、本質を損なわない程度に容易に解説されており、かつ章の間でのバランスも優れている。

画像処理のパートでは「なぜそうするとうまく処理が可能か」という視点を大事にしつつ、様々な処理方法が導入されている。種々の処理方法を理解する上で必要な説明はフーリエ変換等の数理にも踏み込みつつ、丁寧に記述されており、大変勉強になった。

画像認識のパートでは、古典的な手法や、近年発展著しい深層学習に基づく手法が導入される。画像認識のパートで紹介される手法については、理論の詳細には立ち寄らずに直観的な説明がなされていて初学者を当惑させない工夫がなされていると感じた。その上で、3次元画像処理や動画像処理などの応用上重要な話題にも触れており、興味を掻き立てられた。

最後の章では、画像処理の応用について解説されている。実際にビジネスや工学においてどのように画像処理の技術が活用されているかに関して、事例を通して学ぶことができて勉強になった。

全体を通じて対象読者層が明確になっており、その対象者が理解すべき本質的な事柄をできる限り易しく解説する快著である。

読者モニターレビュー【よっしー様（ご専門：情報系）】

この本を読んで一番最初に思ったことは画像処理と画像認識の両分野を非常にコンパクトにまとめているということである．画像処理や画像認識の専門書は個別に作られていたり，両方の内容が載っていたとしても重厚な本になることが多い．しかし本書は両分野の知識をバランスよく配分し，詳細な数学的なアルゴリズムをあえて省略することで，初学者にわかりやすい画像に関して体系的な本になっている．

私は画像認識が専門なので今回は画像処理部分をメインに本を読ませて貰ったが，エッジ検出や局所特徴などプログラムではパッケージ化されている部分を理論的に知れたことが良かった．

このように画像に関して興味がある初学者や画像処理，画像認識のどちらか一方でも知識に不安があるという方におすすめしたい一冊である．

レビュー,書籍紹介・書評掲載情報一覧