IoT時代のデータ処理の基本と実践 - スマホ内蔵センサ取得データを用いて -

IoT時代のデータ処理の基本と実践 - スマホ内蔵センサ取得データを用いて -

統計解析,機械学習,信号処理初学者が,IoTによる膨大なデータの解析や処理の前提となる知識やデータ処理の基本を身につけられる

ジャンル
発行年月日
2018/03/20
判型
A5
ページ数
176ページ
ISBN
978-4-339-02880-5
  • 内容紹介
  • まえがき
  • 目次
  • 著者紹介

本書では,これから統計解析,機械学習,信号処理を学ぶ学生が,IoTによる膨大なデータの解析や処理の前提となる知識やデータ処理の基本を身につけられる。スマホの加速度センサを例に,取得したデータ処理の方法も体験できる。

数十年前までは,いつでも,どこでも,だれとでも,を目標としていた通信システムは,今や当然のものとなり,通信速度の高速化はいうに及ばず,機器の小型化,低消費電力化を実現し,多くのユーザがその利便性を享受している。さらに今日では,IoT(Internet of Things)という言葉に代表されるように,人ばかりではなく,人とモノ,モノとモノがつながり,データをやりとりしている。各種センサの小型化とともにそれらのデータをワイヤレスで伝送することにより,センサ設置の負荷やコストが大幅に抑えられ,結果としてデータの収集がきわめて容易に,そして大規模なデータになっている。

このような中で,データの分類やそれらの本質を把握すること,データから有意な情報を抽出することなどのために,得られたデータに対する処理技術がますます重要になってきている。これにより客観的に事象を分析すること,課題解決の指針を得ることも可能であり,そして,それらの巧拙によって大きな差異が生じる時代であるといえる。

本書はこのような背景を踏まえ,得られたデータに対して,客観的な解析,処理を行うために必要となる基本的なデータ処理,解析の技法を述べるものである。これから専門的な統計解析,機械学習,信号処理を学んでいく,あるいは研究対象とする学生が,その前準備として,前提となる基礎知識やデータ処理技術の基本を身につけることのできる教科書あるいは参考書となることを目的として執筆している。

第1章では基本中の基本である各種統計量について述べ,第2章では代表的なデータ解析手法である回帰分析,第3章は推定と検定について,その手法とともに得られたデータの有意性の判定方法などを例を示して説明している。第4章では,三つの基本的なデータの判別方法を取り上げ,それらの考え方を示している。これは機械学習の基礎となるものである。第5章では時系列データに対する代表的な解析手法であるフーリエ解析について述べ,そして第6章では信号処理技術として,ディジタルフィルタの構成とその効果を示す。

本書では可能な限り,具体的な例を示して読者の理解を高めるように配慮している。数学的な厳密さよりも,実際の問題への適用という観点を重視している。最初から順を追って読んでいくことが望ましいが,興味を持った章から読み,必要となる知識を他の章から得るように読み進めていくことも可能である。スマートフォン(スマホ)には多数のセンサが実装されているが,その中から加速度センサを取り上げ,実際に取得したデータを用いて解析している。データ取得のためのプログラムもAndroid端末用であるが,ダウンロード可能である。実際に自分のスマホでデータを取得してデータ処理方法を体験することにより,より理解が深まると思われる。また,本書で取り上げたExcelのデータをコロナ社の本書籍詳細ページ(http://www.coronasha.co.jp/np/isbn/9784339028805/)よりダウンロードできる。理解を深めるために,必要に応じて活用していただきたい。読者が本書を通して基本知識を習得し,つぎのステップにつなげることができれば,本書はその目的を十分に達したものと考えている。

最後に,本書の企画を担当し,執筆の機会をくださったコロナ社にこの場を借りてお礼を申し上げたい。スマホのセンサデータの取得方法として,MITApp Inventorの紹介とともに,日頃より多くの示唆をくださる神奈川工科大学情報工学科教授の山本富士男先生に深謝したい。また,執筆にあたり,プログラムや図面の作成に寄与してくれた本学学生の金田一将君,門倉 丈君,岡安優奈さんに感謝する。

2018年1月 著者しるす

1. 統計処理の基本
1.1 基本統計量
 1.1.1 平均値
 1.1.2 最頻値
 1.1.3 中央値
 1.1.4 分散
 1.1.5 標本分散と不偏分散
 1.1.6 標準偏差
1.2 分布
 1.2.1 度数分布
 1.2.2 ヒストグラム
 1.2.3 累積度数
1.3 正規化
1.4 クロス集計
 1.4.1 クロス集計の意義
 1.4.2 クロス集計の作成
1章の振り返り

2. 回帰分析
2.1 単回帰分析
 2.1.1 回帰直線の算出
 2.1.2 回帰直線の評価
 2.1.3 Excelを用いた単回帰分析
 2.1.4 Excelの分析ツールによる単回帰分析
2.2 重回帰分析
 2.2.1 回帰直線の算出
 2.2.2 Excelを用いた重回帰分析
2.3 最小二乗法と最尤推定
2章の振り返り

3. 推定と検定
3.1 母集団と標本
3.2 正規分布
3.3 標準正規分布
3.4 大数の法則と中心極限定理
3.5 t分布
3.6 統計的推定
3.7 統計的検定
3.8 推定手法
 3.8.1 母平均の区間推定
 3.8.2 母比率の区間推定
3.9 検定手法
 3.9.1 基本的考え方と手順
 3.9.2 p値の算出方法
 3.9.3 母平均の検定
 3.9.4 母比率の検定
3章の振り返り

4. データの分類
4.1 類似度
4.2 2グループの分離度
 4.2.1 群内変動
 4.2.2 群間変動
 4.2.3 相関比
4.3 線形判別分析
4.4 k近傍法
4.5 マハラノビスの距離
4章の振り返り

5. フーリエ解析
5.1 時間領域と周波数領域
5.2 周期信号と正弦波信号
5.3 フーリエ級数
5.4 複素表現
5.5 複素フーリエ級数
5.6 フーリエ変換
5.7 離散時間フーリエ変換
5.8 離散フーリエ変換
5.9 高速フーリエ変換
 5.9.1 ExcelでのFFTの利用
 5.9.2 合成波へのFFTの適用
5章の振り返り

6. フィルタによる信号処理
6.1 移動平均
6.2 ノイズの圧縮
6.3 フィルタ処理
 6.3.1 フィルタの種類
 6.3.2 フィルタ設計の考え方
 6.3.3 フィルタの特性とその効果
6章の振り返り

付録
A. 加速度データの取得方法
 A.1 MITAppInventor2
 A.2 プログラム実行の準備
 A.3 使用プログラムと利用方法
B. ピボットテーブルの作り方
C. 分析ツールの設定
D. 分析ツール(メニューからの呼び出し)
E. ディジタルフィルタに関するプログラム
 E.1 フィルタの周波数特性を求めるプログラム
 E.2 各フィルタの効果を確認するプログラム
 E.3 振動の影響を除去するプログラム

引用・参考文献
振り返りの解答
索引

田中 博(タナカ ヒロシ)

五百蔵 重典(イオロイ シゲノリ)

関連資料(一般)

関連資料一覧