書名で キーワードで

詳細検索 >>

HOME  > 情報工学  / データサイエンス  / ビッグデータ  > フルスタックJavaScriptとPython機械学習ライブラリで実践するソーシャルビッグデータ

書籍詳細

  フルスタックJavaScriptとPython機械学習ライブラリで実践するソーシャルビッグデータ
- 基本概念・技術から収集・分析・可視化まで -

▼ 目次を読む

▼ 目次をたたむ

石川博 首都大東京教授 博士(理学) 編著

横山昌平 首都大東京准教授 博士(工学) 著

廣田雅春 岡山理科大講師 博士(情報学) 著

… 著者ホームページです

発行年月日:2019/02/18 , 判 型: B5,  ページ数:192頁

ISBN:978-4-339-02889-8,  定 価:3,456円 (本体3,200円+税)

本書は,ソーシャルビッグデータの基本概念そしてデータマイニングや機械学習の基本技術の理解から,具体的にコンピュータ環境の構築と分析ツールの実装方法を解説し,データの収集・可視化・分析までを自学自習できるようにした。

本書で使用したサンプルコードを掲載しています。

【目次】

第I部 基礎編
1. ビッグデータ
1.1 ビッグデータの特徴
1.2 実世界データ
1.3 オープンデータ
第I部 基礎編
1. ビッグデータ
1.1 ビッグデータの特徴
1.2 実世界データ
1.3 オープンデータ
1.4 ソーシャルデータ
1.5 ソーシャルビッグデータ
 1.5.1 実世界データとソーシャルデータのインタラクション
 1.5.2 ユニバーサルキー
1.6 イシカワ・コンセプト,そしてジオソーシャルビッグ
 1.6.1 ソーシャルビッグデータ利用の一般的な流れ
 1.6.2 ソーシャルビッグデータの4番目のv
1.7 ソーシャルビッグデータ応用(ケーススタディ)
 1.7.1 ケース1―観光応用:掘り出し物スポット発見(ソーシャルデータ×印象評価)
 1.7.2 ケース2―観光応用:トピックの地域的影響(異種ソーシャルデータ×クラスタリング&グラフモデル)
 1.7.3 ケース3―観光応用:観光資源名の意味(ソーシャルデータ&オープンデータ×Word2Vec)
 1.7.4 ケース4―観光応用:見頃推定(ソーシャルデータ&オープンデータ×時系列分析)
 1.7.5 ケース5―観光応用:FreeWi-Fiスポット設置候補(異種ソーシャルデータ×統合分析)
 1.7.6 ケース6―防災応用:危険避難路発見(ソーシャルデータ&オープンデータ×グラフモデル)
 1.7.7 ケース7―科学応用:中央丘クレーターの発見(オープンデータ(実世界データ)×ディープラーニング)
1.8 本書で学んでほしいこと
 1.8.1 データサイエンティストとデータエンジニア
 1.8.2 データサイエンティスト

2. データマイニング・機械学習の基本技術
2.1 概論
2.2 データマイニングとは
 2.2.1 データマイニングの細分化
2.3 データマイニングと周辺分野の関連
 2.3.1 データベース
 2.3.2 統計解析
 2.3.3 機械学習
2.4 データマイニングのプロセス
 2.4.1 データの選択
 2.4.2 データの前処理
 2.4.3 データの変換
 2.4.4 パターン,知識の発見
 2.4.5 解釈と評価
2.5 クラスタリング
 2.5.1 概要
 2.5.2 階層的クラスタリング
 2.5.3 k-means
 2.5.4 DBSCAN
2.6 分類
 2.6.1 概要
 2.6.2 k近傍法
 2.6.3 決定木
 2.6.4 SVM
 2.6.5 ディープラーニング
2.7 その他の手法
 2.7.1 アンサンブル学習
 2.7.2 相関ルール

第II部 実践編
3. ソーシャルビッグデータ分析を支えるWeb技術
3.1 フルスタックJavaScript
 3.1.1 サーバ上のJavaScript
 3.1.2 データベース上のJavaScript
 3.1.3 本書で実装するシステムの構成
3.2 環境構築
 3.2.1 Node.jsのインストール
 3.2.2 MongoDBのインストール
 3.2.3 実装ディレクトリの準備
3.3 Web3層アーキテクチャの実装
 3.3.1 Webサーバ
 3.3.2 WebSocket
 3.3.3 WebSocketによるチャットプログラム
 3.3.4 JavaScript object notation(JSON)
 3.3.5 GeoJSON
 3.3.6 MongoDBの利用
 3.3.7 Node.jsからMongoDBへのアクセス
 3.3.8 非同期処理環境における処理フローの記述
 3.3.9 MongoDBとWebSocketによるチャットプログラム

4. データを集める
4.1 ソーシャルビッグデータを知る
4.2 ソーシャルビッグデータの収集
 4.2.1 検索によるTwitterデータの収集
 4.2.2 新着監視によるTwitterデータの収集
 4.2.3 検索によるFlickrデータの収集
 4.2.4 新着監視によるFlickrデータの収集
 4.2.5 DBpediaを用いたWikipediaデータの収集
4.3 ジオソーシャルビッグデータの収集
 4.3.1 ジオタグ付きツイートの収集
 4.3.2 ジオタグ付き写真の収集
 4.3.3 OpenStreetMapへの問い合わせ
4.4 クローラの実装と運用
 4.4.1 クローラ機能のパッケージ化
 4.4.2 さらに高度な実装のために

5. データを可視化する
5.1 可視化ライブラリのインストール
 5.1.1 チャート描画
 5.1.2 カラーパレット
5.2 ソーシャルデータ分析可視化環境の準備
 5.2.1 プログラムのインストール
 5.2.2 分析対象ソーシャルデータのクロール
5.3 散布図
5.4 ワードクラウド
5.5 地図描画
5.6 ヒートマップ

6. データを分析する
6.1 準備
6.2 線形回帰
6.3 k-means
6.4 DBSCAN
6.5 機械学習
6.6 TF-IDF
6.7 おわりに

引用・参考文献
索引

【関連情報】

【おすすめ本】

【レビュー】

読者モニターレビュー【S様】

本書は,ソーシャルビッグデータの分析について,実際のコードを動かしながら分析手法を学ぶことができます。
技術的な概要を学び,実際にコードを動かして全体的な流れを身に着けるというコンセプトで書かれているため、これからデータ分析を始めたい人のための入門書として良いと思います。

本書は二部構成となっています。
第一部では,最初にソーシャルビックデータの定義とその分析について説明します。
ソーシャルビッグデータの分析とは,例えば地図情報などの実世界のデータと,twitterやflickrなどのソーシャルデータを同期データを分析することを指します。
分析の具体例として,観光地の満足度を分析するという例が本書では取り上げられています。
これは,ツイートの位置情報,および,その位置に至る前後のツイートからその位置の満足度を分析するというものです。これによって様々な場所についてその場所の価値(満足度)を評価できるという例です。

そのあとに,データマイニングのプロセスや、データマイニングの手法,機械学習の手法について学びます。
データマイニングのプロセスでは,データの選択,データの前処理,データの変換,パターン・知識の発見,解釈と評価という一連のプロセスについて学びます。
手法では,階層的クラスタリングやk-meansなどのクラスタリング,k近傍法,決定木,SVMなどの分類手法に概要に触れています。

第一部では,ソーシャルビックデータの定義とその分析が実例をもとに説明されていて理解しやすかったです。
また,様々な手法の概要がシンプルに説明されていて,どのような手法なのか把握しやすかったです。

第二部では,ウェブ環境の構築,データ収集,可視化,分析について学びます。
ウェブ環境の構築では,nodejsを使った,webサーバ,websocket, MongoDBの基本的な使い方に触れます。

次に,twitter,Flickr,オープンな地図情報のOpenStreetMapなどのデータ収集方法とクローラーを実装します。
twitter,Flickrは検索によりデータを収集します。これらを使うときにはAPIキーの取得が必要ですが,取得方法については本の範囲外なので,自分で調べる必要があります。

そして,クロールしたソーシャルデータの可視化方法として,散布図,ワードクラウド,地図描画,ヒートマップといった例を上げています。

最後に,pythonを使って,線形回帰,k-means,DBSCAN,機械学習,TF-IDFなどの分析を実際に行います。
pythonのコードについてはほとんど解説がありませんでした。
pythonでの機械学習の実装についてを本書に期待している場合には期待外れになると思います。

第二部はgithubにソースコードがすべて公開されているので,これらを動かして確認しながら学ぶことができたので良かったです。
ソースコードは必要最小限の構成として書かれているので,理解しやすいです。ただし,事前知識としてnodejsで書かれたjavascriptのコードを読むための簡単な知識が必要です。

読者モニターレビュー【Y.N.様(大学生)】

サブタイトルにもあるように,まさに「基本概念・技術から収集・分析・可視化まで」広く学ぶことができる1冊です。ソーシャルビックデータとは何なのかという定義から,実際のユースケースで理解が深まりました。データマイニングと機械学習についても前半で広く説明がされています。

また実践編では,ソーシャルビックデータに欠かせないWeb技術について「Web3層アーキテクチャの実装」をカバーしていたのが印象的で勉強になりました。「データの収集・分析・可視化」は,Twitterなど様々なAPIを活用する最新のコードが掲載されているので色々応用できると思います。

本の冒頭にも述べられているように,本分野の初学者ですぐに実務や研究で実践する知識とコードを手に入れたい場合は前著の『ソーシャル・ビッグデータサイエンス入門―基本概念からマイニング技術,応用まで』から読んだ方が理解しやすいかもしれないと感じました。本書はさらにそれらの知識と実装を広く展開した1冊でした。

在庫は時期によりまして変動することがございますので、ご了承ください。