コース概要
導入
このセクションでは、機械学習をいつ使用すべきか、何を考慮すべきか、それが何を意味するか(長所と短所を含む)について一般的な導入を行います。データ型(構造化/非構造化/静的/ストリーミング)、データの妥当性/量、データ駆動型とユーザー駆動型の分析、統計モデルと機械学習モデルの違い、教師なし学習の課題、バイアス-分散トレードオフ、反復/評価、交差検証のアプローチ、教師あり/教師なし/強化学習について解説します。
主要トピック
1. ナビベイズの理解
- ベイズ手法の基本概念
- 確率
- 同時確率
- ベイズの定理を用いた条件付き確率
- ナビベイズアルゴリズム
- ナビベイズ分類
- ラプラス推定量
- ナビベイズでの数値特徴の使用
2. 決定木の理解
- 分割統治法
- C5.0決定木アルゴリズム
- 最適な分割の選択
- 決定木の剪定
3. ニューラルネットワークの理解
- 生物学的ニューロンから人工ニューロンへ
- 活性化関数
- ネットワークトポロジー
- 層の数
- 情報の伝達方向
- 各層のノード数
- 逆伝播法によるニューラルネットワークの訓練
- ディープラーニング
4. サポートベクターマシン(SVM)の理解
- \r
- 超平面による分類
- 最大マージンの探索
- 線形分離可能なデータの場合
- 非線形分離可能なデータの場合
- 非線形空間でのカーネルの活用
5. クラスタリングの理解
- 機械学習のタスクとしてのクラスタリング
- クラスタリングのためのk-meansアルゴリズム
- 距離を用いたクラスタの割り当てと更新
- 適切なクラスタ数の選択
6. 分類のパフォーマンス測定
- 分類予測データの処理
- 混同行列の詳細な確認
- 混同行列を用いたパフォーマンス測定
- 精度を超えて - 他のパフォーマンス指標
- カッパ統計量
- 再現率と特異度
- 適合率と再現率(Recall)
- F測度
- パフォーマンストレードオフの可視化
- ROC曲線
- 将来のパフォーマンスの推定
- ホールドアウト法
- 交差検証
- ブートストラップサンプリング
7. モデルのチューニングによるパフォーマンス向上
- caretを用いた自動パラメータチューニング
- 単純なチューニング済みモデルの作成
- チューニングプロセスのカスタマイズ
- メタラーニングによるモデルパフォーマンスの向上
- アンサンブリングの理解
- バギング
- ブースティング
- ランダムフォレスト
- ランダムフォレストの訓練
- ランダムフォレストのパフォーマンス評価
補足トピック
8. 最近傍法を用いた分類の理解
- kNN(k最近傍法)アルゴリズム
- 距離の計算
- 適切なkの選択
- kNNで使用するためのデータ準備
- kNNアルゴリズムが「怠惰(lazy)」である理由
9. 分類ルールの理解
- 分離統治法
- One Ruleアルゴリズム
- RIPPERアルゴリズム
- 決定木からのルール抽出
10. 回帰の理解
- 単回帰分析
- 最小二乗推定
- 相関関係
- 重回帰分析
11. 回帰木とモデル木の理解
- 木への回帰要素の追加
12. 関連ルールの理解
- 関連ルール学習のためのAprioriアルゴリズム
- ルールの関心度を測定する - 支持度と信頼度
- Apriori原理を用いたルールセットの構築
追加トピック
- Spark/PySpark/MLlibとマルチアームドバンディット
要求
Pythonの知識
お客様の声 (7)
トレーニングを非常に楽しんでおり、機械学習についてより深く学ぶことができました。理論と実践のバランスが取れていたことに感謝しており、特に手を動かすコーディングセッションが印象的でした。講師は魅力的な例とよく設計された演習を提供し、学習体験を豊かにしてくれました。コースでは幅広いトピックが取り上げられ、Abhiは全ての質問に明確かつ容易に回答することで優れた専門知識を示しました。
Valentina
コース - Machine Learning
機械翻訳
この演習が、理論を理解し、段階的に適用するのに非常に役立ったことを感謝しています。また、講師がシンプルで明確な説明を行ってくれたことも高く評価しています。Python に詳しくない私でも、内容を追うのは簡単でした。それでも、興味深いテーマを学ぶ機会を逃したくなかったのです。 さらに、提供された情報の多様性と、講師が理解のために説明やサポートを惜しまなかったことも感謝しています。このコースを受けてから、機械学習の概念がより明確になり、今ではテーマに対する方向性とより深い理解を得ることができました。
Cristina
コース - Machine Learning
機械翻訳
トレーニングの終わりに、提示された主題が現実の使用例を見ることができました。
Daniel
コース - Machine Learning
機械翻訳
ペースが良くて、理論と実践のバランスも良かったです。また、主要なトピックを網羅し、トレーナーがすべてをうまくバランスさせる方法にも満足しています。さらに、あなたの研修インフラも気に入っています。VMで作業するのがとても便利でした。
Andrei
コース - Machine Learning
機械翻訳
簡潔に。 概念の直感的な理解と視覚モデルを作成(決定木グラフ、線形方程式、モデルの動作を証明するために手動で y_pred を計算)。
Nicolae - DB Global Technology
コース - Machine Learning
機械翻訳
これは、機械学習の理解という私の目標を達成するのに大いに役立ちました。 Pabloがこのトピックに対する適切な紹介を行ってくれたことに大きな敬意を表します。3日間のトレーニング後には、このトピックがどれほど広範であるかが明確になります。また、皆で自由に実験を行うことができるようにしてくれた高性能な仮想マシンのアイデアにも非常に満足しました!
Silviu - DB Global Technology
コース - Machine Learning
機械翻訳
実践的な部分では、理論が具体的な形になる様子を見るのは素晴らしいことです。
Lisa Fekade - Vodacom
コース - Machine Learning
機械翻訳