書籍
書籍検索
送料無料

エンジニア入門シリーズ

Pythonではじめる異常検知入門―基礎から実践まで―

監修: 笛田 薫 (滋賀大学)
著: 江崎 剛史 (滋賀大学)、李 鍾賛 (大阪経済法科大学)
定価: 3,850円(本体3,500円+税)
判型: A5
ページ数: 206 ページ
ISBN: 978-4-910558-19-6
発売日: 2023/4/17
管理No: 117
購入者限定ダウンロードサービス

ご利用方法:上記ボタンをクリックすると、ログイン画面が表示されますので、ID/パスワードを入力してください。

正誤表
2024/1/25更新

【目次】

第Ⅰ部 異常検知の準備

第1章 イントロダクション

  1. 1-1 異常検知とは何か
  2. 1-2 各章のつながり

第2章 異常検知のデータサイエンス

  1. 2-1 得られたデータの見える化(可視化)
  2. 2-2 得られたデータの数式化:回帰モデル
    1. 2-2-1 回帰モデルの構築
    2. 2-2-2 モデルの当てはまりの良さ
  3. 2-3 交差検証法
  4. 2-4 次元圧縮:主成分分析
    1. 2-4-1 主成分の導出
    2. 2-4-2 寄与率と累積寄与率
    3. 2-4-3 主成分スコア
    4. 2-4-4 因子負荷量と主成分の解釈
  5. 2-5 ベイズの定理
    1. 2-5-1 事象の設定
    2. 2-5-2 事象の確率
    3. 2-5-3 条件付き確率
    4. 2-5-4 ベイズの定理

第3章 異常度と評価指数

  1. 3-1 データに基づいた異常検知
  2. 3-2 異常度:正常と異常を判別する客観的基準
    1. 3-2-1 異常度算出の例1:データ間の距離を参考に正常と異常を考える
    2. 3-2-2 異常度算出の例2:正規分布を仮定して正常と異常を考える
  3. 3-3 異常検知の性能評価
    1. 3-3-1 正常データに対する精度
    2. 3-3-2 異常データに対する精度
    3. 3-3-3 分岐精度とF値
    4. 3-3-4 ROC曲線の下部面積
  4. 3-4 この章で使用したPythonコード

第4章 距離に基づいた異常検知

  1. 4-1 はじめに
  2. 4-2 類似度(距離)
  3. 4-3 距離に基づく異常検知のアプローチ
    1. 4-3-1 全てのデータ点との距離
    2. 4-3-2 最近傍(Nearest Neighbor)からの距離
    3. 4-3-3 k近傍(Nearest Neighbor)からの平均距離
    4. 4-3-4 k最近傍までの距離の中央値

第Ⅱ部 データの特性でアプローチを決める

第5章 入出力の情報に基づくアプローチ

  1. 5-1 通常状態からの乖離に基づく検知:ホテリングT2
    1. 5-1-1 データが従う確率分布の仮定
    2. 5-1-2 異常度の算出
    3. 5-1-3 異常判別の閾値設定
  2. 5-2 過去の傾向からの乖離に基づく検知:k-近傍法
    1. 5-2-1 データが従う確率分布の仮定
    2. 5-2-2 異常度の算出
    3. 5-2-3 異常判別の閾値設定
  3. 5-3 特定の構造から外れたデータの検知:One-Class SVM
    1. 5-3-1 データを囲む最小の球を考える
    2. 5-3-2 異常度の定義
    3. 5-3-3 カーネルトリック
    4. 5-3-4 異常判別の閾値設定
  4. 5-4 この章で使用したPythonコード

第6章 時系列情報に基づくアプローチ

  1. 6-1 定常状態の時系列データの異常検知
    1. 6-1-1 前の時点との相関を調べる
    2. 6-1-2 異常度の算出
    3. 6-1-3 異常度判別の閾値設定
  2. 6-2 非定常状態の時系列データの異常検知
    1. 6-2-1 差分をとって定常状態とみなせる形に変換する
    2. 6-2-2 異常度の算出
    3. 6-2-3 異常度判別の閾値設定
  3. 6-3 この章で使用したPythonコード

第Ⅲ部 実践

第7章 異常検知の実践例

  1. 7-1 複数入力データの異常検知
    1. 7-1-1 通常状態からの乖離に基づく検知:ホテリングT2
    2. 7-1-2 特定の構造から外れたデータの検知:One-Class SV
    3. 7-1-3 補足:ホテリングT2とOne-Class SVMの違い
  2. 7-2 時系列データの異常検知
    1. 7-2-1 気温データの時系列解析
    2. 7-2-2 補足:時系列モデルのパラメータ推定

第8章 補足

  1. 8-1 Pythonのインストールと実行
    1. 8-1-1 Anacondaのインストール
    2. 8-1-2 Jupyter notebookを使ったインタラクティブ環境
    3. 8-1-3 簡単な計算
    4. 8-1-4 変数の型
    5. 8-1-5 データ構造
    6. 8-1-6 プログラムの基本(for文とif文)
    7. 8-1-7 データの可視化
    8. 8-1-8 ライブラリのインストール
  2. 8-2 分岐ルールを作るアプローチ(Isolation Forest)
  3. 8-3 異常検知の理解に有用な文献・サイト
    1. 8-3-1 統計の基礎知識に関する書籍
    2. 8-3-2 一般的な統計に関する書籍
    3. 8-3-3 さらに進んだ統計の学習のための書籍
    4. 8-3-4 機械学習に関する書籍
    5. 8-3-5 データの可視化に関する書籍
    6. 8-3-6 Pythonの使い方に関する書籍
    7. 8-3-7 異常検知に関する書籍・Webサイト
    8. 8-3-8 データを使ったビジネス課題の解決のヒントになる書籍

【参考文献】

  • 川野秀一,松井秀俊,廣瀬慧,スパース推定法による統計モデリング,共立出版,2018.
  • 椎名洋,姫野哲人,保科架風,データサイエンスのための数学,講談社,2019
  • 小島寛之,完全独習ベイズ統計学入門,ダイヤモンド社,2015.
  • 鹿島亨,吉松賢治,久津間康博,半導体市場向け、歩留まり向上FDCシステムSavemation Review,23(2),pp. 76–83,2005.
  • 井出剛,入門機械学習による異常検知,コロナ社,2015.
  • 井出剛,杉山将,異常検知と変化検知,講談社,2015.
  • 小野田崇,伊藤憲彦,是枝英明,水力発電所における異常予兆発見支援ツールの開発,電気学会論文誌D(産業応用部門誌),131(4),pp. 448–457,2011.
  • 島田直希,時系列解析- 自己回帰・状態空間モデル・異常検知,共立出版,2019
  • 下川敏雄,杉本知之,後藤昌司,樹木構造接近法(R で学ぶデータサイエンス9),共立出版,2013

【口コミ】

  • ※口コミはありません。
ページトップへ戻る