基礎から学ぶデータマイニング
データマイニングという技術の代表的な手法とプログラムを用いた応用例について解説した。
- 発行年月日
- 2013/04/26
- 判型
- A5
- ページ数
- 160ページ
- ISBN
- 978-4-339-02470-8
- 内容紹介
- 目次
コンピュータで処理できるデータは膨大に生成されているが,価値ある情報を発見することは困難である。そこで,データマイニングという技術が注目されている。本書では,代表的な手法とプログラムを用いた応用例について学ぶ。
1. データマイニングとその周辺
1.1 データマイニング
1.1.1 ルール指向マイニングの例
1.1.2 相関ルールマイニングの例
1.2 テキストマイニング,グラフマイニング,Webマイニング
1.3 統計,機械学習とデータマイニング
1.4 発想支援とデータマイニング
2. データの形式,事前処理,俯瞰
2.1 データについて
2.1.1 名詞型,数値型データ
2.1.2 テキストデータ
2.1.3 ネットワークデータ
2.2 データマイニングの事前処理
2.2.1 数値型データから名詞型データへの変換
2.2.2 欠損値の取り扱い
2.2.3 テキストデータの分解(形態素解析)
2.3 データの俯瞰
2.3.1 名詞型データの俯瞰
2.3.2 数値型データの俯瞰
2.3.3 ネットワークデータの俯瞰
章末問題
3. データマイニングの手法
3.1 確率指向マイニング
3.1.1 条件付き確率と予測
3.1.2 ベイズの定理
3.1.3 ナイーブベイズ
3.1.4 数値型データの取り扱い
3.1.5 ベイジアンネットワーク
3.1.6 ベイジアンネットワーク分類器
3.2 ルール指向マイニング
3.2.1 ディシジョンツリー
3.2.2 情報量とエントロピー
3.2.3 ID3のアルゴリズム
3.2.4 C4.5のアルゴリズム
3.3 関数指向マイニング
3.3.1 ニューラルネットワークの構造
3.3.2 ニューラルネットワークの設計
3.3.3 ニューラルネットワークの計算
3.3.4 ニューラルネットワークの学習
3.4 インスタンス指向マイニング
3.4.1 データの類似性
3.4.2 最近傍法のアルゴリズム
3.5 クラスタリング
3.5.1 K-meansのアルゴリズム
3.5.2 各グループの初期値
3.5.3 K-meansの計算例
3.5.4 クラシフィケーションとクラスタリング
3.6 相関ルールマイニング
3.6.1 多頻度アイテム集合の抽出
3.6.2 多頻度アイテム集合からのルールの生成
3.7 テキストデータのマイニング
3.8 ネットワークデータのマイニング
章末問題
4. データマイニング手法の評価
4.1 評価方法の概要
4.1.1 教師あり学習と教師なし学習
4.1.2 学習用のデータとテスト用のデータ
4.1.3 データマイニングアルゴリズムの評価環境
4.2 分類率
4.3 TP rate,FP rate
4.4 precision,recall,F-measure
4.5 ROC領域
章末問題
5. データマイニングの実践例
5.1 2次元の領域分割
5.1.1 領域分割
5.1.2 データマイニングアルゴリズムの特徴
5.2 戦車ゲームのためのデータマイニング
5.2.1 ロボコード
5.2.2 本書における戦車の目的:上下運動をする相手戦車を撃つ
5.2.3 3種類の戦車による命中精度の違い
5.2.4 学習用のデータの作成方法と命中精度
5.3 センサ情報からのデータマイニング
5.4 Web上のテキスト情報からのデータマイニング
5.5 Twitterのフォロー関係の可視化
5.6 友人ネットワークの可視化
5.6.1 分析するデータについて
5.6.2 調査終了時点における友人ネットワークの特徴
5.6.3 2か月の間に友人ネットワークがどのように変化したか
5.6.4 部分ネットワークの構造に着目した友人ネットワークの成長過程の分析
引用・参考文献
章末問題解答
索引