お問い合わせ

コース概要

導入

このセクションでは、機械学習をいつ使用すべきか、何を考慮すべきか、それが何を意味するか(長所と短所を含む)について一般的な導入を行います。データ型(構造化/非構造化/静的/ストリーミング)、データの妥当性/量、データ駆動型とユーザー駆動型の分析、統計モデルと機械学習モデルの違い、教師なし学習の課題、バイアス-分散トレードオフ、反復/評価、交差検証のアプローチ、教師あり/教師なし/強化学習について解説します。

主要トピック

1. ナビベイズの理解

  • ベイズ手法の基本概念
  • 確率
  • 同時確率
  • ベイズの定理を用いた条件付き確率
  • ナビベイズアルゴリズム
  • ナビベイズ分類
  • ラプラス推定量
  • ナビベイズでの数値特徴の使用

2. 決定木の理解

  • 分割統治法
  • C5.0決定木アルゴリズム
  • 最適な分割の選択
  • 決定木の剪定

3. ニューラルネットワークの理解

  • 生物学的ニューロンから人工ニューロンへ
  • 活性化関数
  • ネットワークトポロジー
  • 層の数
  • 情報の伝達方向
  • 各層のノード数
  • 逆伝播法によるニューラルネットワークの訓練
  • ディープラーニング

4. サポートベクターマシン(SVM)の理解

    \r
  • 超平面による分類
  • 最大マージンの探索
  • 線形分離可能なデータの場合
  • 非線形分離可能なデータの場合
  • 非線形空間でのカーネルの活用

5. クラスタリングの理解

  • 機械学習のタスクとしてのクラスタリング
  • クラスタリングのためのk-meansアルゴリズム
  • 距離を用いたクラスタの割り当てと更新
  • 適切なクラスタ数の選択

6. 分類のパフォーマンス測定

  • 分類予測データの処理
  • 混同行列の詳細な確認
  • 混同行列を用いたパフォーマンス測定
  • 精度を超えて - 他のパフォーマンス指標
  • カッパ統計量
  • 再現率と特異度
  • 適合率と再現率(Recall)
  • F測度
  • パフォーマンストレードオフの可視化
  • ROC曲線
  • 将来のパフォーマンスの推定
  • ホールドアウト法
  • 交差検証
  • ブートストラップサンプリング

7. モデルのチューニングによるパフォーマンス向上

  • caretを用いた自動パラメータチューニング
  • 単純なチューニング済みモデルの作成
  • チューニングプロセスのカスタマイズ
  • メタラーニングによるモデルパフォーマンスの向上
  • アンサンブリングの理解
  • バギング
  • ブースティング
  • ランダムフォレスト
  • ランダムフォレストの訓練
  • ランダムフォレストのパフォーマンス評価

補足トピック

8. 最近傍法を用いた分類の理解

  • kNN(k最近傍法)アルゴリズム
  • 距離の計算
  • 適切なkの選択
  • kNNで使用するためのデータ準備
  • kNNアルゴリズムが「怠惰(lazy)」である理由

9. 分類ルールの理解

  • 分離統治法
  • One Ruleアルゴリズム
  • RIPPERアルゴリズム
  • 決定木からのルール抽出

10. 回帰の理解

  • 単回帰分析
  • 最小二乗推定
  • 相関関係
  • 重回帰分析

11. 回帰木とモデル木の理解

  • 木への回帰要素の追加

12. 関連ルールの理解

  • 関連ルール学習のためのAprioriアルゴリズム
  • ルールの関心度を測定する - 支持度と信頼度
  • Apriori原理を用いたルールセットの構築

追加トピック

  • Spark/PySpark/MLlibとマルチアームドバンディット

要求

Pythonの知識

 21 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (7)

今後のコース

関連カテゴリー