画像処理と画像認識 - AI時代の画像処理入門 -

画像処理と画像認識 - AI時代の画像処理入門 -

「画像処理工学(改訂版)」(メカトロニクス教科書シリーズ)に新しいトピックを追加改訂

ジャンル
発行予定日
2022/09/下旬
判型
B5
予定ページ数
200ページ
ISBN
978-4-339-02931-4
画像処理と画像認識 - AI時代の画像処理入門 -
近刊

予定価格

3,410

電子版を購入

購入案内

  • 内容紹介
  • まえがき
  • 目次
  • 著者紹介

【書籍の特徴】
本書では,幅広いトピックを入門的に扱いながら,信号処理技術,画像処理手法,画像計測やグラフィックス,さらに機械学習や深層学習を中心に広範な領域となっている画像認識などの分野をバランス良く配分させ,基礎事項を体系的に学べるように,以下の構成とした。また,OpenCVなどのフリーのライブラリや深層学習のフレームワークを用いて画像処理や認識を行う方々にとって必要な「理論的基礎知識」も本書により得られる。

【本書の構成】
1章:「序論」では,人間の視覚機能と画像処理工学の関係について述べ,画像処理技術がわれわれの生活にどのように役立っているかについて述べる。
2章:「画像の表現」では,ディジタル画像の特徴とその表現方法について述べる。
3章:「画像処理システム」では,コンピュータによる画像処理システムや専用ハードウェアの構成および,画像入出力のための機器について述べる。
4章:「画像情報処理」では,画像情報の処理で特に重要となるフーリエ変換等の直交変換についての基礎的事項を取り上げる。また,これらを応用したフィルタ処理や画像データの圧縮についても述べる。
5章:「濃淡画像処理」では,濃淡画像に対してよく用いられるコントラストの改善,ノイズの除去,特徴の抽出,画像の幾何学的形状の変換などの画像処理手法について述べる。
6章:「2値画像処理」では,2値画像を用いる目的と2値化処理の手法について述べる。
7章:「コンピュータグラフィックス」では,2次元および3次元CGにおける基本的なCGの手法について概説する。
8章:「領域分割」では,物体認識や画像合成などに用いられる重要な処理の一つである領域分割の代表的な手法について述べる。
9章:「特徴・パターンの検出」では,まずテンプレートマッチングについて説明した後,パターン認識でよく用いられる図形の形状特徴である局所特徴とその求め方について述べる。
10章:「画像認識」では,概要およびパターンの識別手法について述べる。
11章:「ニューラルネットワークと深層学習」では,まずはニューラルネットワークについて説明し,画像認識が著しい性能向上を果たした大きな要因である深層学習や,畳み込みニューラルネットワークの原理と応用について詳しく述べる。
12章:「3次元画像処理」では,1枚あるいは複数の画像から3次元情報を復元したり,3次元環境の計測や認識を行う方法について述べる。
13章:「動画像処理」では,オプティカルフローの抽出,差分画像を利用する方法などの代表的な手法について述べる
14章:「画像処理の応用」では,画像処理の応用事例について触れ,これまでに述べた画像処理技術が実際にどのように利用されているかについて述べる。

☆発行前情報のため,一部変更となる場合がございます

本書は,画像処理を初歩から学習しようとするさまざまな分野の方を対象として,2000年に「画像処理工学」として出版されました。そして2014年には,その後のディジタル化の流れに対応した改訂を行いました。幸いなことに,本書は多くの大学・高専で教科書として採用され,講義等で使用されてきました。

周知のように,この20年で特に深層学習(ディープラーニング)をはじめとするAI(人工知能)関連の技術が大きく発展し,スマートフォンや自動車の安全運転支援をはじめ,多くの分野で画像処理・認識技術が活用されるようになりました。そして,この分野への期待は以前にも増して高まっているといえます。このような背景を踏まえて,本書ではおもに画像認識に関する内容を大幅に拡充し,新たに「画像処理と画像認識~AI時代の画像処理入門~」として出版することになりました。

画像処理で扱われる領域はたいへん広く,信号処理技術,画像処理手法,画像計測やグラフィックスなどさまざまな分野に及びます。それに加えて画像認識の領域も機械学習や深層学習を中心とした広範な分野があり,学ぶべき項目も膨大になります。このため,既存の教科書では,おかれている重点分野もさまざまに異なっています。本書では,前著と同様に幅広いトピックを入門的に扱いながら,これらの分野をバランス良く配分させ,基礎事項を体系的に学べるように構成しました。

特に,今回の改訂では第8章以降の構成を重点的に見なおし,全14章構成としました。また,それ以外の章でも一部古くなった内容を削除し,必要性の高い新規項目を追加しました。ただし,現在教科書として採用頂いている講義でも,これまで通りに使用できるよう,既存の構成をできるだけ保ちつつ最新の情報を加筆しました。今回新規に追加された部分については,発展的内容や自習用の参考として使って頂いてもよいと思います。一方で,画像認識やコンピュータビジョンの教科書として用いる場合は,第2章~7章の基礎的内容を必要に応じてスキップし,第8章~14章を中心に講義で使うことができるものと思います。

近年,インターネットよりOpenCVなどのフリーのライブラリが簡単に手に入り,初学者でも画像処理や認識のプログラムを実行できるようになりました。また,深層学習を含む最先端の研究ソースも大学や研究機関などにより公開されており,誰もが容易に利用できるようになっています。それらを導入する際に必要な理論的な基礎知識を,本書により得ることができるものと思います。一方で,各項目の本質をわかりやすく説明するために,詳細なアルゴリズムや数学的手法の多くは,あえて省略せざるを得ませんでした。そこで,本書によって基礎的知識を習得後,読者の皆さんがさらに高度な知識を得たい場合には,巻末の参考文献やインターネット上の文献等を参照いただければ幸いです。

本書の執筆にあたっては,多くの引用・参考文献を参考にさせていただきました。これら著者の方々には心から感謝申し上げます。

最後に,本書を出版するに当たってたいへんお世話になったコロナ社の関係各位に深くお礼を申し上げます。
2022年8月
著者

☆発行前情報のため,一部変更となる場合がございます

1. 序論
1.1 人間の視覚機能
1.2 画像と画像処理
1.3 ビジョンシステム
1.4 AIと画像処理
演習問題

2. 画像の表現
2.1 アナログ画像とディジタル画像
2.2 画像のA―D変換
 2.2.1 標本化
 2.2.2 量子化
2.3 A―D変換と画質との関係
2.4 カラー画像の表現
 2.4.1 人間の視覚とカラー画像
 2.4.2 色の表現法
 2.4.3 カラー画像のディジタル化
2.5 画像データの表現
 2.5.1 画像データの表現方式
 2.5.2 インデックス方式による画像表現
 2.5.3 画像のファイル形式
演習問題

3. 画像処理システム
3.1 画像処理システムの構成例
 3.1.1 コンピュータを用いた画像処理システム
 3.1.2 画像処理プログラムにおける高速化のための留意点
 3.1.3 専用ハードウェアによる画像処理装置
3.2 画像の入出力装置
 3.2.1 画像の入力装置
 3.2.2 画像の出力装置
演習問題

4. 画像情報処理
4.1 画像のフーリエ変換
 4.1.1 空間周波数
 4.1.2 複素正弦波信号
 4.1.3 フーリエ変換
 4.1.4 離散フーリエ変換
 4.1.5 高速フーリエ変換
 【コラム1】直交変換と直交基底
 4.1.6 直交変換
 【コラム2】直交変換とDFT
 4.1.7 その他の直交変換
4.2 標本化定理
4.3 フィルタ処理
 4.3.1 周波数領域でのフィルタ処理
 【コラム3】FIRフィルタとIIRフィルタ
 4.3.2 空間領域でのフィルタ処理
 【コラム4】畳み込みの意味と線形時不変フィルタ
 4.3.3 フィルタの設計
 4.3.4 オペレータによるフィルタ処理
 【コラム5】局所処理と大局処理
4.4 画像データの圧縮
 4.4.1 可逆符号化
 4.4.2 不可逆符号化
 4.4.3 動画像の符号化
 4.4.4 標準化された符号化技術
 【コラム6】JPEG非可逆圧縮の特徴
演習問題

5. 濃淡画像処理
5.1 濃度変換
 5.1.1 コントラスト変換関数を用いた濃度変換
 【コラム7】ガンマ補正による濃度変換
 5.1.2 ヒストグラム変換
 5.1.3 隣接する画素との濃度差の強調
5.2 平滑化
 5.2.1 線形フィルタによる平滑化
 5.2.2 エッジを保存した平滑化
5.3 鮮鋭化
 【コラム8】画像超解像
5.4 エッジ線の検出
 5.4.1 差分型によるエッジ検出
 5.4.2 零交差法によるエッジ検出
 5.4.3 レンジフィルタ
 5.4.4 Cannyエッジ検出器
5.5 画像表示のための処理
 5.5.1 限定色表示
 5.5.2 疑似濃淡表示
5.6 幾何学的変換
 5.6.1 アフィン変換
 5.6.2 疑似アフィン変換
 5.6.3 画像の再配列と内挿
 5.6.4 圧縮された画像データからの拡大縮小
演習問題

6. 2値画像処理
6.1 2値化処理
6.2 連結性と幾何学的性質
 6.2.1 連結と近傍
 6.2.2 幾何学的性質
6.3 2値画像に対する処理
 6.3.1 ラベリング
 6.3.2 膨張収縮処理
 6.3.3 線点図形化処理
6.3 図形の形状特徴
演習問題

7. コンピュータグラフィックス
7.12 次元グラフィックス
 7.1.1 線図形の描画
 7.1.2 面の生成と処理
 7.1.3 アンチエリアシング
7.2 3次元グラフィックス
 7.2.1 3次元図形の幾何学的変換
 7.2.2 モデリング
 7.2.3 レンダリング
 【コラム9】CGと画像処理技術の融合
演習問題

8. 領域分割
8.1 原画像中のエッジを用いる方法
8.2 領域拡張法
8.3 特徴空間におけるクラスタリングを用いた方法
8.4 テクスチャ解析
8.5 グラフカット法
8.6 深層学習を用いた領域分割
演習問題

9. 特徴パターンの検出
9.1 テンプレートマッチング
9.2 局所特徴
 9.2.1 Harrisのコーナの検出
 9.2.2 FASTによるコーナ検出
 9.2.3 Blobの検出
 9.2.4 SIFT
 9.2.5 HOG
 【コラム10】さまざまな記述子
 9.2.6 Bag-of-VisualWords
演習問題

10. 画像認識
10.1 画像認識のタスクとプロセス
10.2 ルールベースに基づく画像認識
10.3 統計的パターン認識
 10.3.1 特徴空間
 10.3.2 パターンの識別
 【コラム11】訓練データの前処理
 10.3.3 クラスタリング
 【コラム12】遺伝的アルゴリズム
演習問題

11. ニューラルネットワークと深層学習
11.1 ニューラルネットワーク
11.2 深層学習
 11.2.1 活性化関数の改良
 11.2.2 ドロップアウト
 11.2.3 訓練データと学習手順
 【コラム13】訓練データの作成
 11.2.4 転移学習とファインチューニング
11.3 畳み込みニューラルネットワーク
 11.3.1 畳み込み層
 11.3.2 プーリング層
 11.3.3 出力層
 11.3.4 CNNの応用
 【コラム14】CNNのネットワークモデル
11.4 オートエンコーダ
11.5 敵対的生成ネットワーク
演習問題

12. 3次元画像処理
12.1 3次元空間の計測と認識
12.2 1枚の画像を用いた3次元認識
 12.2.1 テクスチャによる方法
 12.2.2 陰影による方法
 12.2.3 その他の方法
12.3 複数の画像を用いた3次元認識
 12.3.1 カメラモデルとキャリブレーション
 12.3.2 ステレオ画像処理
12.4 レンジファインダ
 【コラム15】3次元データ処理を行うソフトウェア
12.5 3次元形状の復元
演習問題

13. 動画像処理
13.1 オプティカルフローの抽出
 13.1.1 照合法
 13.1.2 時空間勾配法
13.2 差分画像を利用する方法
13.3 動画像を用いた行動認識
 13.3.1 従来の機械学習を用いた方法
 13.3.2 深層学習を用いた方法
 13.3.3 RNNとLSTM
13.4 動画像を用いた3次元復元
演習問題

14. 画像処理の応用
14.1 産業応用
 14.1.1 組立工程
 14.1.2 検査工程
 【コラム16】従来の機械学習と深層学習
14.2 医療用画像処理
 14.2.1 CT
 14.2.2 細胞診の自動化
 14.2.3 深層学習による画像診断支援
 【コラム17】説明可能なAI とネットワークの可視化
14.3 文字認識
 14.3.1 印刷文字認識
 14.3.2 手書き文字認識
 14.3.3 深層学習を用いた文字認識
14.4 顔の認証
 【コラム18】オープンソースの活用
演習問題

引用参考文献
演習問題の解答
索引

山田 宏尚(ヤマダ ヒロナオ)

末松 良一(スエマツ ヨシカズ)