コース概要

導入

  • グラフデータベースとライブラリ

グラフデータの理解

  • グラフをデータ構造としての理解
  • 頂点(ドット)とエッジ(線)を使用して現実世界のシナリオをモデル化する

グラフデータベースを使用したグラフデータのモデリング、永続化、処理

  • ローカルグラフアルゴリズム/トラバース
  • neo4j, OrientDB, Titan

演習: neo4jを用いたグラフデータのモデリング

  • ホワイトボードでのデータモデリング

グラフデータベースを超えて: グラフコンピューティング

  • プロパティグラフの理解
  • 異なるシナリオのためのグラフモデル(ソフトウェアグラフ、議論グラフ、概念グラフ)

トラバースを使用した現実世界の問題解決

  • グラフ上のアルゴリズム/指向性ウォーク
  • 循環依存関係の特定

ケーススタディ: 議論参加者のランキング

  • 貢献議論の数と深さによるランキング
  • 感情分析と概念分析についての一言

グラフコンピューティング: ローカル、インメモリグラフツールキット

  • グラファンalysisと可視化
  • JUNG, NetworkX, iGraph

演習: NetworkXを用いたグラフデータのモデリング

  • NetworkXを使用して複雑なシステムをモデル化する

グラフコンピューティング: バッチ処理グラフレームワーク

  • Hadoopを使用したストレージ(HDFS)と処理(MapReduce)の活用
  • 反復アルゴリズムの概要
  • Hama, Giraph, GraphLab

グラフコンピューティング: グラフ並列計算

  • ETL、探索的分析、反復的なグラフ計算を単一システム内で統合する
  • GraphX

セットアップとインストール

  • HadoopとSpark

GraphXオペレーター

  • プロパティ、構造、結合、近傍集約、キャッシュとアンキャッシュ

Pregel APIを使用した反復処理

  • 送信、受信、計算のための引数の渡し方

グラフの構築

  • 頂点とエッジをRDDまたはディスク上で使用する

スケーラブルアルゴリズムの設計

  • GraphX最適化

追加アルゴリズムへのアクセス

  • PageRank, コネクテッドコンポーネント, トライアングルカウント

演習: Page Rankとトップユーザー

  • テキストファイルを使用したグラフデータの構築と処理

本番環境へのデプロイ

閉講の言葉

要求

  • Javaのプログラミングとフレームワークについての理解
  • Pythonについての一般的な理解は役立ちますが、必須ではありません
  • データベース概念についての一般的な理解

対象者

  • 開発者
 28 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (3)

今後のコース

関連カテゴリー