ソーシャル・ビッグデータサイエンス入門 - 基本概念からマイニング技術,応用まで -

ソーシャル・ビッグデータサイエンス入門 - 基本概念からマイニング技術,応用まで -

  • 石川 博 首都大東京教授 博士(理学)

ソーシャルビッグデータの基本から応用まで,全体像を伝えることを目指した。

ジャンル
発行年月日
2014/11/07
判型
A5
ページ数
304ページ
ISBN
978-4-339-02482-1
ソーシャル・ビッグデータサイエンス入門 - 基本概念からマイニング技術,応用まで -
在庫あり
2営業日以内に出荷致します。

定価

4,620(本体4,200円+税)

カートに入れる

電子版を購入

購入案内

  • 内容紹介
  • 目次
  • 著者紹介

本書は,現実世界データとソーシャルメディアデータとの間のインタラクションで説明できる様々なビッグデータ応用のモデリング,それを支えるマイニング技術と解析手法,さらにそれらの活用方法までを具体的な事例を交え解説した。

Ⅰ編 ソーシャルビッグデータの基本概念と応用
1. ソーシャルメディア各論
1.1 ソーシャルメディアとは何か
1.2 代表的なソーシャルメディア
1.2.1 ツイッター (Twitter)
1.2.2 フリッカー (Flickr)
1.2.3 YouTube
1.2.4 フェイスブック (Facebook)
1.2.5 ウィキペディア (Wikipedia)
1.2.6 Web
1.2.7 その他のソーシャルメディア

2. ビッグデータとソーシャルメディア
2.1 ビッグデータ
2.2 実世界とソーシャルメディアのインタラクション
2.3 統合的フレームワーク
2.4 インタラクションのモデル化と分析
2.5 統合分析モデル:概念層
2.6 仮説の生成と検証:論理層
2.7 もう一つの関心:インタラクションマイニング
2.8 分散並列計算基盤:物理層
2.8.1 データベースとNoSQL
2.8.2 並列分散コンピューティングの仕組み:MapReduce
2.8.3 Hadoop

3. ビッグデータ時代の仮説
3.1 仮説とは何か
3.2 仮説のためのサンプリング
3.3 仮説の検証
3.4 仮説を立てる
3.4.1 帰納的推論
3.4.2 演繹的推論
3.4.3 もっともらしい推論
3.4.4 アブダクション
3.4.5 相関関係
3.4.6 因果関係
3.4.7 類推
3.4.8 推移律
3.5 仮説の抽象度
3.6 仮説再訪

4. ソーシャルビッグデータの応用
4.1 分析対象としてのWebとソーシャルメディアの相違
4.2 構成要素に基づくソーシャルメディア分析の応用
4.3 目的から見たソーシャルメディア分析の応用
4.4 MiPSモデルによる具体例の記述
4.4.1 単純な仮説
4.4.2 より複雑な仮説
4.4.3 疑似相関関係を含む仮説
4.5 展望
補遺1. ビッグデータ時代のデータサイエンティストに求められる能力

Ⅱ編 ソーシャルビッグデータの分析に用いる技術
5. データマイニングの基本概念
5.1 データマイニングとは
5.2 関連技術と問題意識
5.3 データマイニングのタスク
5.4 基本的なデータ構造
5.5 データの質
5.6 まとめ

6. 相関ルールのマイニング
6.1 応用
6.2 基本概念
6.3 相関ルールの種類
6.4 アプリオリアルゴリズムの概要
6.5 相関ルールの生成

7. クラスタリング
7.1 応用
7.2 データ構造
7.3 距離
7.4 クラスタリングとアルゴリズム
7.5 パーティショニングに基づくクラスタリング
7.6 階層的クラスタリング
7.7 クラスタリング結果の評価

8. 分類
8.1 動機
8.2 分類作業
8.3 決定木の導出
8.4 属性選択のための指標
8.5 分類ルールの生成
8.6 基本アルゴリズムの拡張
8.7 精度の計算
8.8 精度の向上
8.9 その他のモデル

9. 予測
9.1 予測と分類
9.2 予測モデル
9.2.1 重回帰モデル
9.2.2 非線形関数の変換
9.2.3 パス解析モデル
9.2.4 多重指標モデル
9.2.5 因子分析モデル
9.2.6 因子の回転
9.2.7 共分散構造モデル再訪
9.2.8 因子再訪あるいは次元削除

10. Webの構造マイニング
10.1 Webマイニング
10.2 構造マイニング
10.2.1 計量書誌学
10.2.2 引用文献データベースとインパクトファクタ
10.2.3 研究者の価値:h-index
10.2.4 威信
10.2.5 PageRank
10.2.6 HITS

11. Webの内容マイニング
11.1 検索エンジン
11.1.1 Webページのクローリング
11.1.2 Webページのインデクシング
11.1.3 Webページのランキング
11.2 情報検索技術
11.3 ページの分類
11.4 ページのクラスタリング
11.5 マイクロブログの要約

12. Webの履歴マイニングと情報抽出,深層Webのマイニング
12.1 Webの履歴マイニング
12.1.1 履歴マイニングと推薦
12.1.2 アクセスパタンのクラスタリング
12.1.3 協調フィルタリングとWeb個別化
12.2 情報抽出
12.2.1 情報抽出のタスク
12.2.2 アプローチ
12.3 深層Webのマイニング

13. メディアマイニング
13.1 XML,木構造,グラフのマイニング
13.1.1 XMLマイニングの応用
13.1.2 XML構造マイニング
13.1.3 XML内容マイニング
13.1.4 より一般的な構造に関するマイニング
13.2 マルチメディアマイニング
13.3 ストリームマイニング
13.3.1 クラスタリング
13.3.2 分類
13.3.3 頻出アイテムのカウント
13.3.4 トレンド分析
13.3.5 類似検索

14. スケーラビリティと外れ値検出
14.1 相関分析におけるスケーラビリティへの対策
14.1.1 メモリを共有しない方式
14.1.2 メモリを共有する方式
14.2 クラスタリングにおけるスケーラビリティへの対応
14.2.1 階層的アプローチに基づくクラスタリング
14.2.2 密度の概念に基づくクラスタリング
14.2.3 グラフのクラスタリング
14.3 分類,およびその他のタスクに対するスケーラビリティ
14.4 外れ値検出
補遺2. 媒介中心性:構造,内容,履歴マイニングのあいだの関係についての注意

引用・参考文献
索引