レビュー,書籍紹介・書評掲載情報

フルスタックJavaScriptとPython機械学習ライブラリで実践するソーシャルビッグデータ - 基本概念・技術から収集・分析・可視化まで -

フルスタックJavaScriptとPython機械学習ライブラリで実践するソーシャルビッグデータ - 基本概念・技術から収集・分析・可視化まで -

本書は,ソーシャルビッグデータの基本概念そしてデータマイニングや機械学習の基本技術の理解から,具体的にコンピュータ環境の構築と分析ツールの実装方法を解説し,データの収集・可視化・分析までを自学自習できるようにした。

発行年月日
2019/02/18
定価
3,520(本体3,200円+税)
ISBN
978-4-339-02889-8
在庫あり

レビュー,書籍紹介・書評掲載情報

『電子情報通信学会誌』102巻,12号,2019/12/1,1145頁,copyright(c)2019 IEICE

『電子情報通信学会誌』102巻,12号,2019/12/1,1145頁,copyright(c)2019 IEICE

掲載日:2019/12/01

近年SNS(Social Networking Service)の世界的な普及により,日々ソーシャル由来のデータが大量に蓄積されている.このようなソーシャルデータはデータ分析などを通し,マーケティングや企業戦略など様々な活用がなされており,数あるビッグデータの中でも有用なデータ群の一つとして着目されている.本書はソーシャルデータだけではなく,実世界データやオープンデータも含め,ソーシャルビッグデータとして統一的なデータ分析モデルについて,基本概念・技術から実際に応用の実装に使える収集・分析・可視化のコード群を交えて,実践的に応用を見据えた解説を行っている.

本書は第1部基礎編(1,2章)と第2部実践編(3~6章)から成る2部全6章の構成である.

前半の第1部では1章にて,ソーシャルビッグデータの概念とtwitterなどの代表的なデータについて解説し,更にソーシャルビッグデータの応用事例を紹介している.2章では,データマイニング・機械学習などの技術について解説し,ソーシャルビッグデータ分析に必要な知識の下地作りを行っている.

後半の第2部では,3章にて,フルスタックJavaScriptについて解説を行い,データ分析の環境構築について初心者でも構築できるようにNode.jsとMongoDBのインストールから詳しく解説されている.4章では,初心者にとって最もハードルが高いデータ収集について,クローラー実装をサンプルコードを交えて初心者にも分かりやすく解説している.5章では,データの可視化手法について幾つか紹介し,6章では2章で紹介したデータマイニングの手法を実装し,実際のデータ分析について解説している.

本書にはソーシャルビッグデータの概念・技術に関する知識と有用なサンプルコードが載っているため,本書を読むことで,今までデータ分析の経験が全くない初心者でも,ソーシャルビッグデータの収集から分析・可視化を行うことができるようになるだろう.ソーシャルビッグデータに興味を持っている学生や社会人の方は是非一度本書を御一読されてはいかがでしょうか.

(紹介者荒木徹也正員群馬大学理工学府電子情報部門)
『電子情報通信学会誌』102巻,12号,2019/12/1,1145頁,copyright(c)2019 IEICE

読者モニターレビュー【S様】

掲載日:2019/05/30

本書は,ソーシャルビッグデータの分析について,実際のコードを動かしながら分析手法を学ぶことができます。
技術的な概要を学び,実際にコードを動かして全体的な流れを身に着けるというコンセプトで書かれているため、これからデータ分析を始めたい人のための入門書として良いと思います。

本書は二部構成となっています。
第一部では,最初にソーシャルビックデータの定義とその分析について説明します。
ソーシャルビッグデータの分析とは,例えば地図情報などの実世界のデータと,twitterやflickrなどのソーシャルデータを同期データを分析することを指します。
分析の具体例として,観光地の満足度を分析するという例が本書では取り上げられています。
これは,ツイートの位置情報,および,その位置に至る前後のツイートからその位置の満足度を分析するというものです。これによって様々な場所についてその場所の価値(満足度)を評価できるという例です。

そのあとに,データマイニングのプロセスや、データマイニングの手法,機械学習の手法について学びます。
データマイニングのプロセスでは,データの選択,データの前処理,データの変換,パターン・知識の発見,解釈と評価という一連のプロセスについて学びます。
手法では,階層的クラスタリングやk-meansなどのクラスタリング,k近傍法,決定木,SVMなどの分類手法に概要に触れています。

第一部では,ソーシャルビックデータの定義とその分析が実例をもとに説明されていて理解しやすかったです。
また,様々な手法の概要がシンプルに説明されていて,どのような手法なのか把握しやすかったです。

第二部では,ウェブ環境の構築,データ収集,可視化,分析について学びます。
ウェブ環境の構築では,nodejsを使った,webサーバ,websocket, MongoDBの基本的な使い方に触れます。

次に,twitter,Flickr,オープンな地図情報のOpenStreetMapなどのデータ収集方法とクローラーを実装します。
twitter,Flickrは検索によりデータを収集します。これらを使うときにはAPIキーの取得が必要ですが,取得方法については本の範囲外なので,自分で調べる必要があります。

そして,クロールしたソーシャルデータの可視化方法として,散布図,ワードクラウド,地図描画,ヒートマップといった例を上げています。

最後に,pythonを使って,線形回帰,k-means,DBSCAN,機械学習,TF-IDFなどの分析を実際に行います。
pythonのコードについてはほとんど解説がありませんでした。
pythonでの機械学習の実装についてを本書に期待している場合には期待外れになると思います。

第二部はgithubにソースコードがすべて公開されているので,これらを動かして確認しながら学ぶことができたので良かったです。
ソースコードは必要最小限の構成として書かれているので,理解しやすいです。ただし,事前知識としてnodejsで書かれたjavascriptのコードを読むための簡単な知識が必要です。

読者モニターレビュー【Y.N.様(大学生)】

掲載日:2019/02/13

サブタイトルにもあるように,まさに「基本概念・技術から収集・分析・可視化まで」広く学ぶことができる1冊です。ソーシャルビックデータとは何なのかという定義から,実際のユースケースで理解が深まりました。データマイニングと機械学習についても前半で広く説明がされています。

また実践編では,ソーシャルビックデータに欠かせないWeb技術について「Web3層アーキテクチャの実装」をカバーしていたのが印象的で勉強になりました。「データの収集・分析・可視化」は,Twitterなど様々なAPIを活用する最新のコードが掲載されているので色々応用できると思います。

本の冒頭にも述べられているように,本分野の初学者ですぐに実務や研究で実践する知識とコードを手に入れたい場合は前著の『ソーシャル・ビッグデータサイエンス入門―基本概念からマイニング技術,応用まで』から読んだ方が理解しやすいかもしれないと感じました。本書はさらにそれらの知識と実装を広く展開した1冊でした。