コース概要

導入

    データ サイエンティストの Data Science プロセスの役割と責任

開発環境の準備

    ライブラリ、フレームワーク、言語、ツール ローカル開発 Web ベースの共同開発

データ収集

    さまざまなタイプのデータ構造 ローカル データベース データベース コネクタ 一般的な形式: xlxs、XML、Json、csv など
非構造化クリック、検閲、スマートフォン
  • API
  • Internet of Things (IoT)
  • ドキュメント、写真、ビデオ、サウンド
  • ケーススタディ: 大量の非構造化データを継続的に収集する
  • データストレージリレーショナル データベース 非リレーショナル データベース Hadoop: 分散ファイル システム (HDFS) Spark: 復元力のある分散データセット (RDD) クラウド ストレージ
  • データの準備
  • 取り込み、選択、クレンジング、変換 データ品質の確保 - 正確性、意味、セキュリティ 例外レポート

      Languages 準備、処理、分析に使用

    R 言語 R の概要 データ操作、計算、およびグラフィック表示

      Python Python の紹介

    データの操作、処理、クリーニング、および処理

      データ分析
    探索的分析 基本的な統計 視覚化のドラフト データの理解
  • 因果関係
  • 特徴と変化
  • Machine Learning 監視ありと監視なし

      いつどのモデルを使用するか
    Natural Language Processing (NLP)
  • Data Visualization
  • ベスト プラクティス 適切なデータに適したグラフの選択 カラー パレット 次のレベルへ ダッシュボード インタラクティブな視覚化
  • データを使ったストーリーテリング
  • 要約と結論
  • 要求

    • データベースの概念を一般的に理解していること
    • 統計の基本的な理解
      35 時間
     

    参加者の人数


    開始

    完了


    Dates are subject to availability and take place between 10:00 and 17:00.
    Open Training Courses require 5+ participants.

    お客様の声 (2)

    関連コース

    QGIS for Geographic Information System

      21 時間

    関連カテゴリー