書籍
書籍検索
送料無料

設計技術シリーズ

―Pythonでデータサイエンス―
AI・機械学習のためのデータ前処理[実践編]

著者: 北 研二・松本 和幸・吉田 稔・獅々堀 正幹・大野 将樹(徳島大学)
定価: 2,640円(本体2,400円+税)
判型: B5変型
ページ数: 168 ページ
ISBN: 978-4-910558-01-1
発売日: 2021/8/31
管理No: 97

【目次】

1章 序章

  1. 1.1 前処理の概要
  2. 1.2 プログラムの実行環境

2章 高度な前処理技術

  1. 2.1 カテゴリカルデータから数値データへの変換
    1. 2.1.1 One-hotエンコーディング
    2. 2.1.2 そのほかのエンコーディング手法
    3. 2.1.3 特徴量ハッシング
    4. 2.1.4 エンティティ埋め込み
  2. 2.2 不均衡データの扱い
    1. 2.2.1 オーバーサンプリングとアンダーサンプリング
    2. 2.2.2 クラスに対する重みづけ
  3. 2.3 時系列データの扱い
    1. 2.3.1 窓付き統計値
    2. 2.3.2 タイムゾーンの変換
    3. 2.3.3 データの粒度の変換
    4. 2.3.4 時系列データにおける欠損値の穴埋め

3章 テキストデータの前処理

  1. 3.1 日本語テキストデータ前処理の流れ
  2. 3.2 日本語テキストデータの準備
  3. 3.3 文字コード変換
  4. 3.4 文章の切り出し
  5. 3.5 分かち書きと形態素解析
  6. 3.6 単語以外の切り分け単位
    1. 3.6.1 バイグラム
    2. 3.6.2 単語に依存しない分割
  7. 3.7 単語IDへの変換
  8. 3.8 文ベクトルの生成
  9. 3.9 機械学習の利用
    1. 3.9.1 gensim
    2. 3.9.2 潜在ディリクレ配分法
    3. 3.9.3 サポートベクトルマシン
    4. 3.9.4 単語分散表現
    5. 3.9.5 ニューラルネットワークへの入力

4章 画像データにおける前処理

  1. 4.1 深層学習を用いた画像認識システム
    1. 4.1.1 従来の画像認識システム
    2. 4.1.2 深層学習モデルの導入
    3. 4.1.3 ニューラルネットワーク
    4. 4.1.4 勾配降下法による最適化
    5. 4.1.5 スケーリングによる前処理
  2. 4.2 畳み込みニューラルネットワーク
    1. 4.2.1 CNNの構成
    2. 4.2.2 畳み込み層
    3. 4.2.3 プーリング層
    4. 4.2.4 全結合層
    5. 4.2.5 CNNの実装例
  3. 4.3 画像データに対するデータ拡張
  4. 4.4 ファインチューニング
    1. 4.4.1 ファインチューニングCNN
    2. 4.4.2 VGG16の構成
    3. 4.4.3 サンプルプログラム

5章 音声・音楽データの前処理

  1. 5.1 リサンプリング
  2. 5.2 音量の正規化
  3. 5.3 チャネルのモノラル化
  4. 5.4 スペクトルサブトラクション
    1. 5.4.1 実験用のデータセット
    2. 5.4.2 観測信号の生成
    3. 5.4.3 スペクトルサブトラクションによる雑音除去
    4. 5.4.4 スペクトルサブトラクション型ウィナーフィルタ
  5. 5.5 調波打楽器音分離

【参考文献】

【口コミ】

  • ※口コミはありません。
ページトップへ戻る