コース概要

I. 導入と準備

1. 概要

  • Rをより使いやすくする方法、Rと利用可能なGUI
  • RStudio
  • 関連ソフトウェアとドキュメント
  • Rと統計学
  • インタラクティブにRを使用する
  • 初歩的なセッションの実行
  • 関数や機能に関するヘルプを取得する
  • Rコマンド、大文字小文字の区別など
  • 以前のコマンドの呼び出しと修正
  • ファイルからのコマンド実行または出力のリダイレクト
  • データの永続性とオブジェクトの削除
  • 良いプログラミング習慣:自己完結型スクリプト、読みやすさ(構造化されたスクリプト、ドキュメント、Markdown)
  • パッケージのインストール;CRANとBioconductor

2. データの読み込み

  • テキストファイル (read.delim)
  • CSVファイル

3. 単純な操作;数値とベクトル + 配列

  • ベクトルと代入
  • ベクトルの算術演算
  • 規則的なシーケンスの生成
  • 論理ベクトル
  • 欠損値
  • 文字列ベクトル
  • インデックスベクトル;データセットのサブセットの選択と変更
    • 配列
  • 配列のインデックス。配列の部分セクション
  • インデックス行列
  • array()関数と配列の簡単な操作(乗算、転置など)
  • その他のオブジェクトの種類

4. リストとデータフレーム

  • リスト
  • リストの構築と変更
    • リストの連結
  • データフレーム
    • データフレームの作成
    • データフレームでの作業
    • 任意のリストのアタッチ
    • 検索パスの管理

5. データ操作

  • 観測値と変数の選択、サブセット化
  • フィルタリング、グループ化
  • 再コーディング、変換
  • 集約、データセットの結合
  • 分割行列の形成、cbind()とrbind()
  • 配列用の連結関数 ()
  • 文字列操作、stringrパッケージ
  • grepとregexprの簡単な紹介

6. データの読み込み(詳細)

  • XLS, XLSXファイル
  • readr と readxlパッケージ
  • SPSS、SAS、Stataなどその他のフォーマットのデータ
  • txt、csvおよびその他のフォーマットへのデータエクスポート

6. グループ化、ループ、条件付き実行

  • グループ化された式
  • 制御文
  • 条件付き実行:if文
  • 反復処理:forループ、repeat、while
  • apply、lapply、sapply、tapplyの紹介

7. 関数

  • 関数の作成
  • オプション引数とデフォルト値
  • 可変引数
  • スコープとその影響

8. Rでの単純なグラフィックス

  • グラフの作成
  • 密度プロット
  • ドットプロット
  • 棒グラフ
  • 折れ線グラフ
  • 円グラフ
  • ボックスプロット
  • 散布図
  • 複数のプロットを組み合わせる

II. Rでの統計解析

1. 確率分布

  • Rとしての統計表セット
  • データセットの分布を調査する

2. 仮説検定

  • 母集団平均に関する検定
  • 尤度比検定
  • 一標本と二標本の検定
  • カイ二乗適合度検定
  • コルモゴロフ-スミルノフ一標本統計量
  • ウィルコクソン符号付順位検定
  • 二標本検定
  • ウィルコクソン順位和検定
  • マン-ホイットニー検定
  • コルモゴロフ-スミルノフ検定

3. 複数の仮説検定

  • I型エラーとFDR(False Discovery Rate)
  • ROC曲線とAUC
  • 複数の検定手順(BH、Bonferroniなど)

4. 線形回帰モデル

  • モデル情報抽出用の汎用関数
  • 適合モデルの更新
  • 一般化線形モデル
    • ファミリー
    • glm()関数
  • 分類
    • ロジスティック回帰
    • 線形判別分析
  • 教師なし学習
    • 主成分分析
    • クラスタリング手法(k平均法、階層的クラスタリング、k-メドイド)

5. 生存解析 (survivalパッケージ)

  • Rでの生存オブジェクト
  • Kaplan-Meier推定、対数ランク検定、母集団回帰
  • 信頼帯
  • 検閲(区間検閲)データの解析
  • Cox PHモデル、固定コバリアント
  • Cox PHモデル、時間依存コバリアント
  • シミュレーション:モデル比較 (回帰モデルの比較)

6. 分散分析

  • 一元配置分散分析(One-Way ANOVA)
  • 二元配置分散分析(Two-Way ANOVA)
  • 多変量分散分析(MANOVA)

III. 生物情報学のための演習問題

  • limmaパッケージの簡単な紹介
  • マイクロアレイデータ解析ワークフロー
  • GEOからデータダウンロード: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • データ処理(品質管理、正規化、差動表現)
  • ボルケーノプロット
  • クラスタリングの例 + ヒートマップ
 28 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (5)

今後のコース

関連カテゴリー