データベースと知識発見

データベースと知識発見

  • 北上 始 広島工大教授 博士(工学)
  • 黒木 進 広島市立大准教授 博士(工学)
  • 田村 慶一 広島市立大准教授 博士(情報科学)

データベースの基礎知識だけでなく,社会状況との関係を常に意識し,基礎概念や応用技術も解説した。

ジャンル
発行年月日
2013/10/10
判型
B5
ページ数
176ページ
ISBN
978-4-339-02472-2
データベースと知識発見
在庫あり

定価

3,080(本体2,800円+税)

カートに入れる

電子版を購入

購入案内

  • 内容紹介
  • まえがき
  • 目次
  • 著者紹介

ビッグデータ時代のデータベースには,曖昧な情報の保存利用,巨大で複雑な構造の格納,知識発見など多くの機能が要求されている。本書では,データベースの基礎知識だけでなく,社会状況との関係を常に意識し,応用技術も解説した。

マンチェスター・マークワンと呼ばれるフォン・ノイマン型コンピュータが,1948年に英国のマンチェスター大学のトム・ギルバーンらによって製作されてから半世紀を超えて久しい。マンチェスター・マークワンは,その後,大幅な改良が加えられ,1951年にFerranti Mark 1(4050本の真空管)という名前で世界初の商用マシンが出荷された。同時期に稼働していたコンピュータEDVACを調べると,演算素子に5937本の真空管が使用され,重量7.8トンであったことがわかるが,この事実には,だれでも驚嘆するであろう。その理由は,私たちが日常生活で利用しているPCやスマートフォンなどの情報機器のイメージとは大きくかけ離れるほど,コンピュータ技術が発達してきたからである。コンピュータ技術が発達した背景として,半導体素子の出現と集積技術の進歩が大きく関係していることに間違いはない。集積技術の進歩によってコンピュータ性能は飛躍的に向上し,コンピュータは手のひらサイズにまで小型化した。また,ファイルやデータベースを蓄積するために利用されるストレージとして知られるハードディスクは,1975年頃はわずか数メガバイトの容量でもきわめて高価なものであったが,その後,私たちの想像をはるかに超えて価格性能比が劇的に向上し,現在では,数テラバイトもの容量を持つハードディスクが簡単に入手・利用できるようになっている。

このようなコンピュータ技術の進歩の中で,1990年頃からのインターネットの世界的な普及は,携帯電話やパーソナルコンピュータなどの情報機器の普及率を向上させ,情報量が爆発的な勢いで増え続けている。情報爆発の時代に生み出されるデータには,1980年代から普及している関係データベースとして蓄積されるような構造化されたデータのみならず,ファイルシステムに蓄積されるような非構造化データも含まれている。非構造化データはビッグデータとも呼ばれるようになったが,容量の大きなビッグデータは,不特定多数の人が操作する情報機器やセンサなどを発生源として生み出されるため,情報量は構造化されたデータよりも圧倒的に多い。ビッグデータを活用するには,データベースと統合したり,データウェアハウスやデータマイニング等の技術を利用したりすることが重要になる。

本書では,データベースの基礎的な概念を含む関係データベースを中心に,その原理について解説している。また,データベースやビッグデータからの知識発見のために重要な役割を果たすデータウェアハウスや代表的なデータマイニング手法についても解説している。

データウェアハウスの技術は,データマイニングを実施する前に,分析対象となるさまざまなデータを統合するために有用な技術になっている。なお,本書では,データの検索機構やトランザクション管理,障害回復,分散データベースについては,技術的に詳細な説明を他の書籍に譲り,簡単な説明にとどめている。以上を踏まえて,本書の特徴をまとめると以下のとおりである。
(1)データベースへの問合せ文やデータベース設計で重要となる「キー」を体系的に見つけ出す方法を詳述している。
(2)問合せ言語SQL(structured query language)を実装する際に重要となるが,SQLで表記された問合せ文を満たす関係代数表現をどのように構成すればいいのかを詳述するとともに,関係代数表現の最適化についても触れている。
(3)SQLによる問合せ文の作成を容易にするために,データベース中に存在する複数のテーブルどうしが外部キーを通じて「ネットワーク状に結合されている」という視点を強く意識した説明になっている。
(4)他のデータベースの教科書では見られないマルチメディアデータベースの諸概念について詳述している。また,関係データベースとマルチメディアデータベースの関係について解説している。
(5)データベースやビッグデータの重要な応用技術である「データマイニング」の話題を,データ分類とパターン列挙法という観点で説明している。

本書は,大学や高等専門学校等でデータベースからデータマイニングに至る専門知識を学習する学生が理解することを配慮した内容になっており,データベース技術者やデータサイエンティストの基礎知識を学習しようとする社会人にとっても必要不可欠な内容になっている。なお,各章の担当はつぎのとおりである。1,3,7,8章は北上,2,6章は黒木,4,5章は田村がそれぞれ担当した。本書を読んで,将来,一人でも多くのデータベース技術者やデータサイエンティストが活躍することになれば,著者らにとってこれに勝る喜びはないと考えている。

最後に,本書の出版に際し,株式会社コロナ社の方々に感謝する次第である。
2013年8月
北上 始

1. データベースと情報社会
1.1 データベース管理システム 
1.2 代表的なデータベース 
 1.2.1 ビジネス分野のデータベース 
 1.2.2 学術分野のデータベース 
1.3 さまざまなデータモデル 
 1.3.1 関係データモデル 
 1.3.2 ネットワークデータモデルおよび階層データモデル 
 1.3.3 オブジェクト指向データモデル 
 1.3.4 XMLデータモデル 
1.4 マルチメディアデータベース 
1.5 データベースを内蔵する情報システム 
引用・参考文献 

2. データベースの数学的基礎
2.1 集合と写像
 2.1.1 集合 
 2.1.2 写像 
2.2 集合演算 
2.3 集合と関係 
 2.3.1 二項関係 
 2.3.2 順序関係 
 2.3.3 ハッセ図 
 2.3.4 列挙木 
2.4 命題と述語 
 2.4.1 命題 
 2.4.2 述語 
2.5 線形代数 
 2.5.1 直交行列 
 2.5.2 ユニタリ行列 
 2.5.3 射影行列 
2.6 離散フーリエ変換 
2.7 計算幾何学 
 2.7.1 凸包 
 2.7.2 ボロノイ図 
2.8 情報理論 
演習問題 
引用・参考文献 

3. 関係モデルの諸概念
3.1 テーブル構造 
3.2 スーパキーと候補キー 
 3.2.1 スーパキー 
 3.2.2 候補キー 
3.3 主キーと外部キー 
 3.3.1 主キー 
 3.3.2 外部キー 
3.4 テーブルスキーマの定義 
3.5 テーブルの物理構造 
 3.5.1 タプルの物理的なアドレス 
 3.5.2 索引構造 
演習問題 
引用・参考文献 

4. 関係代数表現とSQL
4.1 データベース言語とテーブル操作の基本 
4.2 関係代数表現 
 4.2.1 関係代数の基本演算 
 4.2.2 関係代数表現とその例 
4.3 質問処理の最適化 
4.4 SQL 
 4.4.1 SQLとその構文 
 4.4.2 SQLの基本形 
 4.4.3 結合質問 
 4.4.4 入れ子型質問 
 4.4.5 集合演算 
 4.4.6 表の更新 
演習問題 
引用・参考文献 

5. データベースの設計
5.1 データモデルとデータモデリング
5.2 正規化理論の基礎
 5.2.1 テーブル更新時に発生する異状
 5.2.2 1事実1テーブル 
 5.2.3 関数従属性 
 5.2.4 多値従属性 
5.3 テーブルの正規化 
 5.3.1 第1正規形 
 5.3.2 第2正規形 
 5.3.3 第3正規形 
 5.3.4 高次の正規形 
5.4 3層スキーマ構造 
5.5 ビュー 
演習問題 
引用・参考文献 

6. マルチメディアデータベース
6.1 空間データベース 
 6.1.1 基本的概念 
 6.1.2 地理的空間モデリング 
 6.1.3 物理レベルでの表現 
 6.1.4 空間DBMSの要件 
 6.1.5 地理的データの操作 
 6.1.6 空間オブジェクトの関係表現 
 6.1.7 空間アクセスメソッド 
 6.1.8 近似アルゴリズム 
6.2 画像データベース 
 6.2.1 画像データの特徴 
 6.2.2 内容に基づく検索 
 6.2.3 多次元索引 
 6.2.4 フィルタとリファインメントによる解法 
演習問題 
引用・参考文献 

7. データマイニング
7.1 知識発見プロセス 
7.2 データウェアハウス 
7.3 オンライン分析処理 
7.4 決定木学習 
 7.4.1 評価基準 
 7.4.2 学習アルゴリズム 
7.5 多次元数値データの分類法 
 7.5.1 クラスタリング 
 7.5.2 サポートベクタマシン 
演習問題 
引用・参考文献 

8. パターンマイニング
8.1 データの論理表現 
8.2 支持数と出現数 
8.3 アイテム集合パターン 
8.4 系列パターン 
 8.4.1 ワイルドカード文字の混在を許さない場合 
 8.4.2 ワイルドカード文字の混在を許す場合 
 8.4.3 曖昧文字の混在を許す場合 
8.5 グラフパターン 
8.6 空間パターン 
演習問題 
引用・参考文献 

演習問題解答 
索引

黒木 進(クロキ ススム)

人工知能関連書籍 特設ページ開設中!人工知能関連の書籍をまとめました。