コース概要

Data Analysis とビッグデータの概要

    Big Data が「大きい」のはなぜですか?ベロシティ、ボリューム、多様性、真実性 (VVVV)
従来のデータ処理の限界
  • 分散処理
  • 統計分析
  • Machine Learning 分析の種類
  • Data Visualization
  • Big Data 役割と責任
  • 管理者 開発者 データ アナリスト

      Languages データ分析に使用される

    R Language データ分析に R を使用する理由データ操作、計算、グラフ表示

      Python データ分析に Python を使用する理由?
    データの操作、処理、クリーニング、および処理
  • Data Analysisへのアプローチ
  • 統計分析 時系列分析 相関モデルと回帰モデルによる予測 推論 Statistics (推定) ビッグ データ セットの記述 Statistics (平均値の計算など)
  • Machine Learning 教師あり学習と教師なし学習

      分類とクラスタリング
    特定の手法のコストを見積もる
  • フィルタリング
  • 自然言語処理 テキストの処理
  • 文章の意味を理解する
  • 自動テキスト生成
  • 感情分析・話題分析
  • Computer Vision 画像の取得、処理、分析、理解
  • 3D シーンの再構築、解釈、理解
  • 画像データを使用した意思決定
  • Big Data インフラストラクチャ
  • データストレージ リレーショナルデータベース (SQL) MySQL Postgres Oracle
  • 非リレーショナル データベース (NoSQL) Cassandra
  • MongoDB
  • Neo4js
  • ニュアンスを理解する 階層型データベース

      オブジェクト指向データベース
    ドキュメント指向データベース
  • グラフ指向データベース
  • 他の
  • 分散処理 Hadoop 分散ファイルシステムとしての HDFS
  • 分散処理のための MapReduce
  • Spark 大規模なデータ処理のためのオールインワンのインメモリ クラスター コンピューティング フレームワーク
  • 構造化ストリーミング
  • スパーク SQL
  • Machine Learning ライブラリ: MLlib
  • GraphXによるグラフ処理
  • Scala能力 パブリッククラウド AWS、Google、AliyunなどプライベートクラウドOpenStack、Cloud Foundryなど
  • 自動スケーラビリティ
  • 問題に対する適切な解決策の選択
  • Big Data の未来
  • 要約と結論
  • 要求

    • 数学の一般的な理解
    • プログラミングの一般的な理解
    • データベースに対する一般的な理解。

    観客

    • 開発者/プログラマー
    • ITコンサルタント
     35 時間

    参加者の人数



    Price per participant

    お客様の声 (2)

    関連コース

    QGIS for Geographic Information System

    21 時間

    関連カテゴリー