コンピュータビジョン - デバイス・アルゴリズムとその応用 -

メディアテクノロジーシリーズ 7

コンピュータビジョン - デバイス・アルゴリズムとその応用 -

多様な画像センサの特性,コンピュータビジョン技術の一般生活環境への応用を紹介。

  • 口絵
ジャンル
発行予定日
2024/09/下旬
判型
A5
ページ数
264ページ
ISBN
978-4-339-01377-1
コンピュータビジョン - デバイス・アルゴリズムとその応用 -
近刊

購入案内

  • 内容紹介
  • まえがき
  • 目次
  • 著者紹介

メディアテクノロジーの発展において画像入出力デバイスとコンピュータビジョン技術は欠くことができない。本書では係る教科書において、これまで省略されることの多かった画像センサと人の一般生活環境への応用を詳述する。

☆発行前情報のため,一部変更となる場合がございます

メディアテクノロジーについて述べる上で,コンピュータビジョン技術の発展と最新動向は欠くことが出来ない.特に深層学習に代表されるAI技術の高度化と普及は目覚ましく,メディアの生成から消費に至るすべての領域を変革しつつある.また一方で,デプスカメラやライトフィールドディスプレイなどに見られるように,画像入出力デバイスも多様化・高機能化が進んでおり,インタラクション・アート・エンタテインメントなど様々なメディア体験のデザインに影響を与えている.

そこでこの書籍では,画像メディア機器とコンピュータビジョンの分野から,メディアテクノロジーにとって影響が大きいにも関わらず,従来の教科書等では漏れがちであった領域や,体系的な記述がなされていない切り口を特に選び,各分野の第一人者により俯瞰的に解説いただくこととした.前半ではまず画像メディアデバイスのうち,画像処理・認識やメディア応用分野の教科書ではほとんど深掘りされることのなかった画像センサについて多くの紙幅を割いた.第1章ではCMOSイメージセンサについて,ダイナミックレンジやノイズなどの諸特性をその根源から理解できるよう平易に解説いただいた.つぎに第2章では,光子計数型カメラやイベントカメラ,LiDARなど,従来型のカメラとは目的や特性が全く異なるセンサについてとりあげた.第3章では2次元画像を入出力する従来型のカメラ・ディスプレイを超える体験を提供しうる,ライトフィールドカメラ・ディスプレイについて概観した.

コンピュータビジョンはその応用分野として,生産工程の自動化などを主眼においたマシンビジョンなどの研究開発も活発に行われているが,近年では家庭用ロボットや自動車の自動走行など,一般生活環境への応用の広がりが著しい.そこで本書では特に「人による鑑賞」と「人を対象とした画像認識」に関係の深いトピックを選定した.具体的には,第4章でリアルなCGや自然なバーチャル環境の生成に重要な,反射特性のモデル化と計測について述べる.続いて第5章では,人とのコミュニケーションや共存のために必須となる,画像による人体の計測・認識・モデル化を取り上げた.第6章では今やコンピュータビジョン分野の中核をなすといっても過言ではない機械学習を軸に,各技術の関係や発展の歴史・経緯,さらには近年の深層学習の急速な発展普及に至る流れについて俯瞰し,最後に第7章ではそれらの研究成果を利用するためのソフトウェアフレームワークとビジネス事例を紹介した.

以上のように,本書はあまたある一般のコンピュータビジョン教科書のような網羅性は求めておらず,むしろ意図的に,相当に偏ったトピック構成となっていることをご理解いただきたい.本書が,画像メディア機器およびコンピュータビジョン技術の最新動向をメディアテクノロジーの研究・開発に活かす上で,新たな手がかりを得る助けとなれば幸いである.

2023年3月
兵庫県立大学 日浦慎作

☆発行前情報のため,一部変更となる場合がございます

1. CMOSイメージセンサの機能と特性
1.1 CMOSイメージセンサの正体
 1.1.1 CMOSイメージセンサの画素の基本機能
 1.1.2 CMOSイメージセンサの画素特性の定式化
 1.1.3 画素に関する重要な事項
 1.1.4 重要なイメージセンサの仕様・特性値
1.2 アナログ・デジタル混載集積回路としてのCMOSイメージセンサ
 1.2.1 設計の流れ
 1.2.2 回路設計のポイント
 1.2.3 CMOSイメージセンサの製造
 1.2.4 集積回路における回路素子
 1.2.5 素子の特性ばらつきの抑制
 1.2.6 回路素子が生じるランダムノイズ
1.3 CMOSイメージセンサの特異性とアーキテクチャの選択
 1.3.1 CMOSイメージセンサ設計の特異性と制約
 1.3.2 回路の稼働率と共有・時分割多重による稼働率の向上
 1.3.3 バス構造を用いた回路の共有化と時分割多重
 1.3.4 並列度によるイメージセンサアーキテクチャの分類
1.4 要素回路
 1.4.1 受光回路
 1.4.2 ユニット選択回路
 1.4.3 プライオリティエンコーダ
 1.4.4 クロックツリー
 1.4.5 スイッチトキャパシタ回路
 1.4.6 A/D変換器

2. 特化した機能・性能をもつイメージセンサ
2.1 光子計数
 2.1.1 SPAD
 2.1.2 高変換ゲインFDアンプ
2.2 高ダイナミックレンジ(HDR)
 2.2.1 マルチ露光時間方式
 2.2.2 マルチ変換ゲイン方式
 2.2.3 マルチフォトダイオード方式
 2.2.4 オーバフロー方式
 2.2.5 飽和時間検出(TTS:time to saturation)方式
2.3 可変解像度(電荷領域)
2.4 イベント駆動型CMOSイメージセンサ
2.5 オンチップ信号処理機能をもつ低電圧・低消費電力イメージセンサ
2.6 LiDARイメージセンサ
 2.6.1 直接法ToF
 2.6.2 間接法ToF
 2.6.3 マルチパス干渉
2.7 符号化露光/読み出し
2.8 光強度以外の検出:波面,波長,偏光

3. ライトフィールドカメラ・ディスプレイ
3.1 ライトフィールドカメラ
 3.1.1 ライトフィールドカメラの分類
 3.1.2 ライトフィールドカメラの研究動向
 3.1.3 ライトフィールドカメラの実用化動向
3.2 ライトフィールドディスプレイ
 3.2.1 ライトフィールドディスプレイの分類
 3.2.2 ライトフィールドディスプレイの周波数特性
 3.2.3 ライトフィールドディスプレイの実装面における技術
 3.2.4 ライトフィールドのHMDへの応用
 3.2.5 ライトフィールドディスプレイの応用技術
 3.2.6 ライトフィールドディスプレイの実用化動向
3.3 本分野の課題と今後

4. 反射・光伝搬のモデル化と計測
4.1 反射現象のモデル化と計測
 4.1.1 放射輝度の計測
 4.1.2 反射モデル
4.2 光伝搬のモデル化と計測
 4.2.1 プレノプティック関数とライトフィールド
 4.2.2 光伝搬行列とライトトランスポート
 4.2.3 反射現象とライトトランスポートの関係
 4.2.4 曲率に依存した反射関数

5. 人物の計測・認識・モデル化
5.1 人物表面形状
 5.1.1 物理的・幾何学的制約に基づいた手法
 5.1.2 統計的形状モデルを用いた手法
 5.1.3 画像から直接推論する手法
 5.1.4 人体3次元形状推定のためのデータセット
5.2 骨格姿勢・運動
 5.2.1 モーションキャプチャ
 5.2.2 マーカーレスモーションキャプチャ
 5.2.3 骨格姿勢推定のためのデータセット
5.3 視線
 5.3.1 眼球を直接計測する手法
 5.3.2 顔画像を計測する手法
 5.3.3 体や顔の動きから推論する手法

6. 現代のCV基盤技術
6.1 画像認識と機械学習
 6.1.1 顔検出
 6.1.2 姿勢推定
 6.1.3 局所特徴量
6.2 深層学習とCV
 6.2.1 データセットとコンペティション
 6.2.2 ニューラルネットワーク
 6.2.3 CNN
6.3 高次特徴量と潜在空間
 6.3.1 end-to-endとpretrainによる転移学習
 6.3.2 中間特徴量とアテンション
 6.3.3 エンコーダ・デコーダと潜在空間への埋め込み表現
 6.3.4 時系列モデル
6.4 CNNによる画像処理
 6.4.1 教師なし学習
 6.4.2 大規模データセットの作成
 6.4.3 潜在空間の利用
 6.4.4 画質の改善への応用

7. CVをとりまく環境
7.1 オープンソースソフトウェア
 7.1.1 コンピュータビジョンライブラリ
 7.1.2 深層学習フレームワーク
7.2 コンピュータビジョンのビジネス事例
 7.2.1 顔検出
 7.2.2 顔認証
 7.2.3 一般物体認識
 7.2.4 物体検出/追跡
 7.2.5 姿勢推定
 7.2.6 拡張現実感
 7.2.7 画像生成
 7.2.8 クラウドサービス
7.3 まとめ

引用・参考文献

日浦 慎作(ヒウラ シンサク)

香川 景一郎(カガワ ケイイチロウ)

小池 崇文(コイケ タカフミ)

久保 尋之(クボ ヒロユキ)

延原 章平(ノブハラ ショウヘイ)

玉木 徹(タマキ トオル)

皆川 卓也(ミナガワ タクヤ)

★特設サイトはこちらから★

各書籍の詳細情報や今後の刊行予定,関連書籍などがご覧いただけます。

https://www.coronasha.co.jp/mediatech/