コンピュータビジョン - 視覚の幾何学 -

コンピュータビジョン - 視覚の幾何学 -

本書は,コンピュータビジョンすなわち計算機による視覚の数理と幾何を,非ユークリッド幾何をもとに基礎から最新理論までを平易に解説した。高度な内容も無理なく学べるよう,多くの図表を使い,直感的に理解しやすい構成とした。

ジャンル
発行年月日
1999/05/07
判型
A5 上製
ページ数
184ページ
ISBN
978-4-339-02363-3
コンピュータビジョン - 視覚の幾何学 -
在庫あり

定価

2,530(本体2,300円+税)

カートに入れる

電子版を購入

購入案内

  • 内容紹介
  • まえがき
  • 目次
  • レビュー
  • 著者紹介

本書は,コンピュータビジョンすなわち計算機による視覚の数理と幾何を,非ユークリッド幾何をもとに基礎から最新理論までを平易に解説した。高度な内容も無理なく学べるよう,多くの図表を使い,直感的に理解しやすい構成とした。

視覚認識の構造を理解しその数理を論じる学問をコンピュータビジョンと呼ぶ。これは,2次元画像から3次元世界に関していかなる情報が得られるかを問うことでもある。

コンピュータビジョンの研究はここ数年目覚ましい進歩を遂げてきた。しかしその結果,初学者が立ち入りにくい分野となり,最新の研究成果が教育に反映されにくくなってきている。人工的な視覚機能がますます多くの分野において要求されている現代にあってこれは非常に残念なことである。本書ではこのような現状を鑑み,コンピュータビジョンの甚礎から最新理論までを学部生レベルの学力で学べるよう企画したものである。高度な内容を無理なく学習できるよう,図を多く取り人れ,直感的に理解しやすい構成とした。

知覚や認識などの曖昧模糊とした分野を理解しようとすると,とかく考え方がヒューリスティックになりがちである。このために場当り的な研究が増え,理路整然とした知識の枠組みが生まれにくいものである。視覚認識の研究もかつてはそうであった。

これに対して近年のコンピュータビジョンの研究は,群や幾何学の力を借りることによって,より一般的かつより強固な理論を生んできた。本書は,コンピュータビジョンの中のこのような幾何学的な側面を述べるものである。割り切れない世界であると考えられがちな知覚や認識の世界の中に,芙しい幾何の構造が存在することを,読者の方々にはぜひ見い出して項きたい。

本書は,情報科学系の学部生,大学院生向けの教科書として書いたものであるが,同時に研究者や技術者の新たなる発見の一助となれば幸いである。

最後に,日頃から多くの御助言を項いているケンブリッジ大学のロベルト・チポラ博士,オックスフォード大学のアンドリュー・ジスマン博士,ルーベンカトリック大学のルーク・バングール教授,大阪大学の臼井良明教授,群馬大学の金谷健一教授,名古屋工業大学の佐藤幸男教授,そして本書の内容に関し多くの御助言を下さった東北大学の出日光一郎教授,ATR人間情報通信研究所の木下敬介博士に深謝する。

1999年3月
佐藤淳

1.コンピュータビジョン
 1.1 視覚とコンピュータビジョン
 1.2 視覚における不定性
 1.3 視覚の課題
 1.4 視覚における非ユークリッド幾何
 1.5 本書の構成
 1.6 表記
2. 投影とカメラモデル
 2.1 投影
  2.1.1 実際のカメラ
  2.1.2 ピンホール・カメラ
  2.1.3 透視投影
  2.1.4 正射影
  2.1.5 弱透視投影
  2.1.6 平行透視投影
 2.2 無限遠と射影空間
  2.2.1 無限遠点、無限遠直線、無限遠平面
  2.2.2 射影直線、射影平面、射影空間
 2.3 斉次座標
  2.3.1 射影直線の斉次座標
  2.3.2 射影平面の斉次座標
  2.3.3 射影空間の斉次座標
  2.3.4 斉次座標による無限遠要素
  2.3.5 双対性
 2.4 透視カメラと射影カメラ
  2.4.1 斉次座標による透視投影
  2.4.2 物理的な座標と画像座標
  2.4.3 カメラ座標とワールド座標
  2.4.4 透視カメラモデル
  2.4.5 射影カメラモデル
  2.4.6 平面の投影
  2.4.7 直線の投影
  2.4.8 一次元射影カメラ
 2.5 弱透視カメラとアフィンカメラ
  2.5.1 弱透視カメラモデル
  2.5.2 アフィンカメラモデル
  2.5.3 平面の投影
  2.5.4 直線の投影
  2.5.5 一次元アフィンカメラ
3. 視覚における不変性と対象物の認識
 3.1 変換群
  3.1.1 群
  3.1.2 変換群
  3.1.3 回転群
  3.1.4 ユークリッド変換群
  3.1.5 相似変換群
  3.1.6 アフィン変換群
  3.1.7 射影変換群
  3.1.8 Lie 群
  3.1.9 部分群
 3.2 平面に関する不変量
  3.2.1 回転不変量、ユークリッド不変量、相似不変量
  3.2.2 アフィン不変量
  3.2.3 射影不変量
 3.3 平面でない対象物に関する不変量
  3.3.1 面対称の場合
  3.3.2 繰返し構造の場合
  3.3.3 回転曲面の場合
 3.4 Lie群における不変量
 3.5 その他の不変量
 3.6 不変量による物体認識
  3.6.1 対象物の識別
  3.6.2 対称性の検出
4. エピポーラ幾何と視覚誘導
 4.1 エピポーラ幾何
 4.2 透視カメラのエピポーラ幾何
  4.2.1 Essential行列
  4.2.2 Fundamental行列
 4.3 射影カメラのエピポーラ幾何
  4.3.1 F行列とエピポーラ幾何
  4.3.2 エピポーラ・ホモグラフィー
  4.3.3 F行列とE行列の求め方
 4.4 アフィンカメラのエピポーラ幾何
 4.5 並進カメラのエピポーラ幾何
 4.6 曲面に関するエピポーラ幾何
  4.6.1 遮蔽輪郭と輪郭生成曲線
  4.6.2 フロンティア点
  4.6.3 エピポーラtangency
  4.6.4 エピポーラbi-tangency
  4.6.5 Rectification
  4.6.6 エピポーラ・パラメタライゼーション
 4.7 視覚誘導
5. 形状復元と複合現実感
 5.1 古典的復元
  5.1.1 校正済みの射影カメラによる復元
  5.1.2 校正済みのアフィンカメラによる復元
 5.2 ユークリッド復元
  5.2.1 ユークリッド変換、相似変換とユークリッド復元
  5.2.2 内部既知で外部未知の透視カメラによる復元
  5.2.3 内部外部ともに未知の透視カメラ+3視点による復元
  5.2.4 ユークリッド復元の例
 5.3 アフィン復元
  5.3.1 アフィン変換とアフィン復元
  5.3.2 未校正のアフィンカメラによる復元
  5.3.3 未校正の並進透視カメラによる復元
  5.3.4 アフィン復元の例
 5.4 射影復元
  5.4.1 射影変換と射影復元
  5.4.2 内部、外部パラメータが未知の射影カメラによる復元
  5.4.3 射影復元の例
 5.5 仮想現実感と複合現実感
  5.5.1 射影復元による複合現実感
  5.5.2 アフィン復元による複合現実感
  5.5.3 複合現実映像の例
6. カメラの校正
 6.1 校正器具を使ったカメラ校正法
 6.2 未知の対象物からのカメラ校正
  6.2.1 絶対円錐曲線
  6.2.2 カメラの校正
  6.2.3 カメラ校正の例
付録.行列に付随する空間
 A.1 行空間と列空間
 A.2 零空間
 A.3 一般化逆行列
 引用・参考文献
 索引

amazonレビュー

佐藤 淳(サトウ ジュン)