コース概要

1日目: 言語の基礎

  • コース紹介
  • データサイエンスについて
    • データサイエンスの定義
    • データサイエンスのプロセス
  • R言語の紹介
  • 変数と型
  • 制御構造 (ループ / 条件分岐)
  • Rのスカラ、ベクトル、行列
    • Rベクトルの定義
    • 行列
  • 文字列とテキスト操作
    • 文字データ型
    • ファイル入出力
  • リスト
  • 関数
    • 関数の紹介
    • クロージャ
    • lapply / sapply関数
  • データフレーム
  • 各セクションの実習

2日目: 中級Rプログラミング

  • データフレームとファイル入出力
  • ファイルからのデータ読み込み
  • データ準備
  • 内蔵データセット
  • 可視化
    • グラフィックスパッケージ
    • plot() / barplot() / hist() / boxplot() / 散布図
    • ヒートマップ
    • ggplot2パッケージ (qplot(), ggplot())
  • dplyrを使用した探索
  • 各セクションの実習

3日目: 高度なRプログラミング

  • Rを使用した統計モデリング
    • 統計関数
    • NAの処理
    • 分布 (二項、ポアソン、正規)
  • 回帰分析
    • 線形回帰の紹介
  • レコメンデーション
  • テキスト処理 (tmパッケージ / クロード)
  • クラスタリング
    • クラスタリングの紹介
    • KMeans
  • 分類
    • 分類の紹介
    • ナイーブベイズ
    • 決定木
    • caretパッケージを使用した学習
    • アルゴリズムの評価
  • Rとビッグデータ
    • データベースへの接続
    • ビッグデータのエコシステム
  • 各セクションの実習

要求

  • 基本的なプログラミングのバックグラウンドが望ましい

セットアップ

  • 最新のラップトップ
  • 最新版のR studioとR環境をインストール
 21 時間

参加者の人数


参加者1人当たりの料金

お客様の声 (7)

今後のコース

関連カテゴリー