入門機械学習による異常検知 - Rによる実践ガイド -

井手剛 IBM ワトソン研究所博士（理学）著

機械学習技術を使って異常検知をやってみたい人のための実用ガイドで，実問題を解く上でぶつかる問題解決の方法を体系的に解説した。

ジャンル

発行年月日: 2015/03/13

判型: A5

ページ数: 288ページ

ISBN: 978-4-339-02491-3

在庫あり

2営業日以内に出荷致します。

定価

4,180円(本体3,800円+税)

カートに入れる

購入案内

内容紹介
目次
レビュー
著者紹介
広告掲載情報

機械学習技術を使って異常検知をやってみたい人のための実用ガイドである。異常検知にかかわる技術の断片をただ羅列せず，実問題を解く上でぶつかる困難に立ち向かうための方法を体系的に解説している。

1.　異常検知の基本的な考え方
1.1　例題：健康診断
1.2　計算機に判定規則をつくらせたい
1.3　「確率分布」で正常パターンをつかむ
1.4　機械学習で確率分布を求める
1.5　やりたいことを具体的に整理する
1.6　異常の度合いを数値で表す
1.7　いろいろな手法を試してみる

2.　正規分布に従うデータからの異常検知
2.1　異常検知手順の流れ
2.2　1変数正規分布に基づく異常検知
　2.2.1　ステップ1：分布推定
　2.2.2　ステップ2：異常度の定義
　2.2.3　ステップ3：閾値の設定
　2.2.4　Rでの実行例
2.3　1変数のホテリング理論の詳細*
　2.3.1　1変数正規分布の最尤推定
　2.3.2　正規変数の和の確率分布（1次元）
　2.3.3　標本分散の確率分布（1次元）
　2.3.4　ホテリング統計量の確率分布（1次元）
2.4　多変量正規分布に基づく異常検知
　2.4.1　ステップ1：多次元正規分布の最尤推定
　2.4.2　ステップ2：異常度の定義
　2.4.3　ステップ3：閾値の設定（ホテリングのT2理論）
　2.4.4　Rでの実行例
2.5　多変数のホテリング理論の詳細*
　2.5.1　多変量正規変数の和の分布
　2.5.2　多変量正規変数の平方和の分布
　2.5.3　ホテリング統計量の分布
2.6　マハラノビス＝タグチ法
　2.6.1　手法の概要
　2.6.2　Rでの実行例
　2.6.3　QR分解*
2.7　t分布による異常判定*
2.8　ホテリング理論の課題
章末問題

3.　非正規データからの異常検知
3.1　分布が左右対称でない場合
　3.1.1　ガンマ分布の当てはめ
　3.1.2　Rでの実行例
　3.1.3　カイ二乗分布による異常度の当てはめ
3.2　訓練データに異常標本が混ざっている場合
　3.2.1　正規分布の線形結合のモデル
　3.2.2　期待値–最大化法：期待値ステップ
　3.2.3　期待値–最大化法：最大化ステップ
　3.2.4　Rでの実行例
3.3　分布がひと山にならない場合：近傍距離に基づく方法
　3.3.1　k近傍法
　3.3.2　局所外れ値度
　3.3.3　カーネル密度推定
　3.3.4　Rでの実行例
3.4　分布がひと山にならない場合：クラスタリングに基づく方法
　3.4.1　k平均法
　3.4.2　混合正規分布モデル
　3.4.3　異常度の定義とRによる実行例
3.5　期待値–最大化法の詳細*
　3.5.1　イエンセンの不等式
　3.5.2　最大化ステップ
3.6　支持ベクトルデータ記述法に基づく異常判定
　3.6.1　データを囲む最小の球
　3.6.2　Rでの実行例
章末問題

4.　性能評価の方法
4.1　基本的な考え方
4.2　正常標本精度と異常標本精度
　4.2.1　正常標本に対する指標
　4.2.2　異常標本に対する指標
4.3　異常検出能力の総合的な指標
　4.3.1　分岐点精度とF値
　4.3.2　ROC曲線の下部面積
4.4　モデルのよさの検証
　4.4.1　モデル選択問題
　4.4.2　交差確認法
　4.4.3　赤池情報量規準とベイズ情報量規準
　4.4.4　赤池情報量規準と平均対数尤度*
　4.4.5　ベイズ情報量規準と周辺尤度*
章末問題

5.　不要な次元を含むデータからの異常検知
5.1　次元削減による異常検知の考え方
5.2　主成分分析による正常部分空間の算出
　5.2.1　分散最大化規準による正常部分空間
　5.2.2　ノルム最大化規準による正常部分空間
　5.2.3　二つの規準の等価性と特異値分解
5.3　主成分分析による異常検知
　5.3.1　異常度の定義
　5.3.2　ホテリングのT2との関係
　5.3.3　次元mの選択
　5.3.4　Rでの実行例
5.4　確率的主成分分析による異常検知*
　5.4.1　主成分分析の確率的モデル
　5.4.2　平均ベクトルの推定
　5.4.3　確率的主成分分析の期待値–最大化法
　5.4.4　σ2→0の極限と次元数mの決定
　5.4.5　確率的主成分分析による異常度の定義
5.5　カーネル主成分分析による異常検知*
　5.5.1　正常部分空間の算出
　5.5.2　Rでの実行例
　5.5.3　異常度の定義（m=1）
　5.5.4　異常度の定義（m>1）
章末問題

6.　入力と出力があるデータからの異常検知
6.1　入出力がある場合の異常検知の考え方
6.2　線形回帰モデルによる異常検知
　6.2.1　問題の定義
　6.2.2　最小二乗法としての最尤推定
　6.2.3　異常度の定義
6.3　リッジ回帰モデルと異常検知
　6.3.1　リッジ回帰の解
　6.3.2　定数λの決定
　6.3.3　異常度の定義
　6.3.4　Rでの実行例
6.4　偏最小二乗法と統計的プロセス制御（1次元出力）
　6.4.1　問題の設定
　6.4.2　正規直交基底による回帰モデルの変換
　6.4.3　NIPALS法（1次元出力）
　6.4.4　異常度の定義と異常検知手順
6.5　正準相関分析による異常検知
　6.5.1　問題設定
　6.5.2　一般化固有値問題としての正準相関分析
　6.5.3　特異値分解による解と異常検知
6.6　ベイズ的線形回帰モデルと異常検知*
　6.6.1　最大事後確率解としてのリッジ回帰
　6.6.2　パラメターσ2の決定
　6.6.3　異常度の定義
章末問題

7.　時系列データの異常検知
7.1　近傍法による異常部位検出
　7.1.1　スライド窓による時系列データの変換
　7.1.2　異常部位検出問題
　7.1.3　Rでの実行例
7.2　特異スペクトル変換法
　7.2.1　特徴的なパターンの算出
　7.2.2　変化度の定義
　7.2.3　Rでの実行例
7.3　自己回帰モデルによる異常検知
　7.3.1　1変数の自己回帰モデル
　7.3.2　ベクトル自己回帰モデル
　7.3.3　次数rの決定
　7.3.4　異常度の定義とRでの実行例
7.4　状態空間モデルによる異常検知*
　7.4.1　線形状態空間モデル
　7.4.2　部分空間同定法：状態系列の推定
　7.4.3　部分空間同定法：未知パラメターA,C,Q,Rの推定
　7.4.4　状態系列の逐次推定法：カルマンフィルタ
　7.4.5　状態空間モデルを用いた異常検知
章末問題

8.　よくある悩みとその対処法
8.1　数式を使いたくありません
8.2　モデルが変わってゆくのですが
8.3　変数の値の範囲が変で困っているのですが
　8.3.1　ロジスティック変換
　8.3.2　ボックス＝コックス変換
8.4　正規分布の結果がおかしいのですが
8.5　データがベクトルになっていないのですが
8.6　異常の原因を診断したいのですが
8.7　分類問題にしてはいけませんか
8.8　さらに発展的な知識を得るために

付録
A.1　有用なRのパッケージ
A.2　確率変数の変換
　A.2.1　確率密度関数と周辺化
　A.2.2　条件付き確率と独立性
　A.2.3　逆変換が一意に定義できる場合の変換
　A.2.4　M変数から1変数への変換
A.3　有用な行列公式
　A.3.1　ブロック行列と逆行列
　A.3.2　行列式
　A.3.3　行列の微分
A.4　正規分布の性質のまとめ
　A.4.1　正規分布の確率密度関数の導出
　A.4.2　単位球の表面積
　A.4.3　正規変数の和の分布
　A.4.4　多変数正規分布の分割公式
　A.4.5　多変数正規分布とベイズ公式
A.5　カーネル密度推定における平均積分二乗誤差の漸近形
A.6　等式制約付きの非線形最適化

引用・参考文献
索引
Rコマンド索引