コース概要

毎日のトピックの内訳: (各セッションは 2 時間)

1 日目: セッション -1: Business 理由の概要 Big Data Business 通信会社のインテリジェンス。

  • T-Mobile、Verizon などのケーススタディ
  • Big Data 北米の通信会社における適応率と、将来のビジネス モデルと運用を Big Data BI にどのように調整しているか
  • 広範な応用分野
  • ネットワークとサービスの管理
  • 顧客離れ Management
  • Data Integration & ダッシュボードの視覚化
  • 不正行為の管理
  • Business ルールの生成
  • 顧客プロファイリング
  • ローカライズされた広告プッシュ

Day-1: Session-2 : Big Data-1の紹介

  • Big Data の主な特徴は、量、多様性、速度、真実さです。ボリューム用の MPP アーキテクチャ。
  • Data Warehouses – 静的スキーマ、ゆっくりと進化するデータセット
  • MPP Database は、Greenplum、Exadata、Teradata、Netezza、Vertica などです。
  • Hadoop ベースド ソリューション – データセットの構造に条件はありません。
  • 典型的なパターン: HDFS、MapReduce (クランチ)、HDFS からの取得
  • バッチ - 分析/非対話型に適しています
  • 容量:CEPストリーミングデータ
  • 一般的な選択肢 – CEP 製品 (例: Infostreams、Apama、MarkLogic など)
  • 本番環境の準備が整っていない – Storm/S4
  • NoSQL Databases – (列およびキー値): データ ウェアハウス/データベースの分析補助として最適

Day-1 : セッション -3 : Big Data-2 の紹介

NoSQL ソリューション

  • KV ストア - キースペース、フレア、スキーマフリー、RAMCloud、Oracle NoSQL Database (OnDB)
  • KV ストア - Dynamo、Voldemort、Dynomite、SubRecord、Mo8onDb、DovetailDB
  • KV ストア (階層) - GT.m、キャッシュ
  • KV ストア (注文済み) - TokyoTyrant、Lightcloud、NMDB、Luxio、MemcacheDB、Acted
  • KV キャッシュ - Memcached、再キャッシュ、Coherence、Infinispan、EXtremeScale、JBossCache、Velocity、Terracoqua
  • Tuple Store - Gigaspaces、Coord、Apache River
  • オブジェクト Database - ZopeDB、DB40、ショール
  • ドキュメント ストア - CouchDB、Cloudant、Couchbase、MongoDB、Jackrabbit、XML-Databases、ThruDB、CloudKit、Prsevere、Riak-Basho、Scalaris
  • ワイドカラム型ストア - BigTable、HBase、Apache Cassandra、Hypertable、KAI、OpenNeptune、Qbase、KDI

データの種類: Big Data の Data Cleaning 問題の紹介

  • RDBMS – 静的な構造/スキーマ。アジャイルで探索的な環境を促進しません。
  • NoSQL – 半構造化されており、データを保存する前に正確なスキーマがなくてもデータを保存できる十分な構造
  • データクリーニングの問題

Day-1 : セッション-4 : Big Data イントロダクション-3 : Hadoop

  • Hadoopを選択するのはどのような場合ですか?
  • 構造化 - エンタープライズ データ ウェアハウス/データベースは大量のデータを (コストをかけて) 保存できますが、構造化が必要です (アクティブな探索には適していません)。
  • 半構造化データ – 従来のソリューション (DW/DB) では困難
  • データの保管 = 多大な労力がかかり、実装後も静的なデータ
  • 汎用ハードウェアで処理されるさまざまなデータと量のデータ – HADOOP
  • Hadoop クラスターの作成に必要な汎用ハードウェア

Map Reduce /HDFS の概要

  • MapReduce – 複数のサーバーにコンピューティングを分散します
  • HDFS – コンピューティング プロセスでデータをローカルで利用できるようにします (冗長性あり)
  • データ – 非構造化/スキーマレスの可能性があります (RDBMS とは異なります)
  • データを理解する開発者の責任
  • Programming MapReduce = Java と連携して (長所/短所)、手動でデータを HDFS にロードします

2 日目: セッション 1.1: Spark : インメモリ分散データベース

  • 「インメモリ」処理とは何ですか?
  • スパーク SQL
  • スパークSDK
  • スパークAPI
  • RDD
  • スパークリブ
  • ハンナ
  • 既存の Hadoop システムを Spark に移行する方法

2 日目セッション -1.2: ストーム - Big Data のリアルタイム処理

  • ストリーム
  • スプラウト
  • ボルト
  • トポロジ

2日目: セッション2: Big Data Management システム

  • 可動部分、計算ノードの起動/失敗 :ZooKeeper - 構成/調整/ネーミング サービス用
  • 複雑なパイプライン/ワークフロー: Oozie – ワークフロー、依存関係、デイジー チェーンを管理
  • デプロイ、構成、クラスター管理、アップグレードなど (システム管理者) :Ambari
  • クラウド内: うなり声
  • 追跡用の進化する Big Data プラットフォーム ツール
  • ETL層アプリケーションの問題

2 日目: セッション 3: Business インテリジェンスにおける予測分析 -1: 基本的なテクニックと機械学習ベースの BI :

  • 機械学習の概要
  • 分類手法の学習
  • ベイジアン予測作成トレーニング ファイル
  • マルコフ乱数場
  • 教師あり学習と教師なし学習
  • 特徴抽出
  • サポートベクターマシン
  • ニューラルネットワーク
  • 強化学習
  • Big Data 大変数問題 - ランダムフォレスト(RF)
  • 表現学習
  • ディープラーニング
  • Big Data 自動化の問題 – マルチモデルアンサンブル RF
  • Soft10-Mによる自動化
  • LDA とトピックモデリング
  • Agile 学習
  • エージェントベースの学習 - 通信事業者の運用例
  • 分散学習 – 通信事業の例
  • 予測分析用のオープンソース ツールの紹介: R、Rapidminer、Mahut
  • よりスケーラブルな Analytic-Apache Hama、Spark、および CMU Graph ラボ

2 日目: セッション 4 予測分析エコシステム 2: Telecom の一般的な予測分析の問題

  • 洞察分析
  • 視覚化分析
  • 構造化された予測分析
  • 非構造化予測分析
  • 顧客プロファイリング
  • レコメンデーションエンジン
  • パターン検出
  • ルール/シナリオの発見 - 失敗、不正、最適化
  • 根本原因の発見
  • 感情分析
  • CRM分析
  • ネットワーク分析
  • テキスト分析
  • テクノロジー支援によるレビュー
  • 不正行為分析
  • リアルタイム分析

3 日目: セッション 1: ネットワーク運用分析 - ネットワーク障害、メタデータからのサービス中断、IPDR および CRM の根本原因分析:

  • CPU使用率
  • メモリ使用量
  • QoSキューの使用状況
  • デバイスの温度
  • インターフェースエラー
  • IOSバージョン
  • イベントのルーティング
  • レイテンシーの変動
  • Syslog分析
  • パケットロス
  • 負荷シミュレーション
  • トポロジー推論
  • パフォーマンスのしきい値
  • デバイストラップ
  • IPDR(IP詳細レコード)の収集と処理
  • 加入者の帯域幅消費量、ネットワーク インターフェイスの使用率、モデムのステータスおよび診断のための IPDR データの使用
  • HFC情報

3 日目: セッション 2: ネットワーク サービス障害分析用ツール:

  • ネットワーク概要ダッシュボード: ネットワーク展開全体を監視し、組織の主要なパフォーマンス指標を追跡します。
  • ピーク期間分析ダッシュボード: 場所固有の粒度で、ピーク使用率を促進するアプリケーションと加入者の傾向を理解します。
  • ルーティング効率ダッシュボード: 相互接続と中継関係を完全に理解して、ネットワーク コストを管理し、資本プロジェクトのビジネス ケースを構築します。
  • リアルタイム エンターテイメント ダッシュボード: ビデオの再生回数、再生時間、ビデオの体験品質 (QoE) などの重要な指標にアクセスします。
  • IPv6 移行ダッシュボード: ネットワーク上での IPv6 の継続的な導入を調査し、トレンドを推進するアプリケーションとデバイスについての洞察を得る
  • ケーススタディ 1: Alcatel-Lucent ビッグ ネットワーク アナリティクス (BNA) データ マイナー
  • 多次元モバイル インテリジェンス (m.IQ6)

3 日目: セッション 3: Big Data Marketing/販売の BI – 販売データから販売/マーケティングを理解する: (すべてのライブ予測分析デモが表示されます)

  • 最高速度のクライアントを特定するには
  • 特定の製品の顧客を特定するため
  • クライアントにとって適切な製品セットを特定するため (レコメンデーション エンジン)
  • 市場セグメンテーション手法
  • クロスセールとアップセールのテクニック
  • クライアントセグメント化手法
  • 売上収益予測手法

3 日目: セッション 4: 通信会社 CFO オフィスに必要な BI:

  • 【4】CFOオフィスに必要な分析業務の概要
  • 新規投資のリスク分析
  • 売上・利益予想
  • 新規顧客獲得予測
  • 損失予測
  • 財務に関する不正分析 (詳細は次回のセッション)

4 日目: セッション 1: 通信詐欺分析の Big Data による不正防止 BI:

  • 帯域幅漏洩 / 帯域幅詐欺
  • ベンダー詐欺/プロジェクトの過剰請求
  • 顧客による返金/不正請求
  • 旅行代金詐欺

4 日目: セッション 2: チャーン予測からチャーン防止まで:

  • 3 種類のチャーン : 積極的/意図的、循環的/偶発的、受動的非自発的
  • 解約した顧客の 3 つの分類: 全体、非表示、部分的
  • チャーンに関する CRM 変数を理解する
  • 顧客行動データの収集
  • 顧客認識データの収集
  • 顧客人口統計データの収集
  • CRMデータのクリーニング
  • 非構造化 CRM データ (顧客からの電話、チケット、電子メール) とチャーン分析のための構造化データへの変換
  • Social Media CRM - 顧客満足度指数を抽出する新しい方法
  • ケーススタディ-1 : T-Mobile USA: 解約率 50% 削減

4 日目: セッション 3: 顧客の不満足の根本原因分析に予測分析を使用する方法:

  • ケーススタディ - 1 : 不満を問題に結び付ける – サービスの中断、帯域幅サービスの低下などの会計、エンジニアリングの失敗
  • ケーススタディ-2: Big Data 通話エスカレーション、問題の重大度、保留中のサービス中断イベントなどのさまざまなパラメーターから顧客満足度指数を追跡する QA ダッシュボード。

4 日目: セッション 4: Big Data 多様なデータと表示に素早くアクセスできるダッシュボード:

  • 既存のアプリケーション プラットフォームと Big Data ダッシュボードの統合
  • Big Data管理
  • Big Data ダッシュボードのケーススタディ: Tableau および Pentaho
  • Big Data アプリを使用して位置情報ベースの広告をプッシュします
  • 追跡システムと管理

Day-5 : セッション-1: Big Data 組織内での BI 導入を正当化する方法:

  • Big Data 実装の ROI の定義
  • アナリストのデータ収集と準備にかかる時間を節約するためのケーススタディ – 生産性の向上
  • 顧客離れによる収益増加のケーススタディ
  • 位置情報ベースの広告やその他のターゲットを絞った広告からの収益増加
  • 統合されたスプレッドシート アプローチにより、およその値を計算します。 Big Data の実装による経費と収益の増加/節約。

5 日目: セッション 2: レガシー データ システムを Big Data システムに置き換えるステップバイステップ手順:

  • 実践的な Big Data 移行ロードマップを理解する
  • Big Data 実装を設計する前に必要な重要な情報は何ですか?
  • データの量、速度、多様性、真実性を計算するさまざまな方法は何ですか
  • データの増加を見積もる方法
  • 2 通信会社のケーススタディ

5 日目: セッション 3 & 4: Big Data ベンダーのレビューとその製品のレビュー。 Q/Aセッション:

  • アクセンチュアアルカテル・ルーセント
  • アマゾン –A9
  • APTEAN (旧 CDC ソフトウェア)
  • Cisco システム
  • クラウドデラ
  • デル
  • EMC
  • Go株式会社オッドデータ
  • グアバス
  • 日立データシステムズ
  • ホートンワークス
  • ファーウェイ
  • HP
  • IBM
  • インフォマティカ
  • インテル
  • ジャスパーソフト
  • Microsoft
  • MongoDB (旧 10Gen)
  • ミューシグマ
  • ネットアップ
  • オペラソリューション
  • Oracle
  • Pentaho
  • プラットフォーラ
  • Qliktech
  • 量子
  • ラックスペース
  • 革命分析
  • Salesforce
  • SAP
  • SAS研究所
  • シセンス
  • ソフトウェアAG/テラコッタ
  • Soft10 オートメーション
  • Splunk
  • スクラル
  • スーパーマイクロ
  • Tableau ソフトウェア
  • Teradata
  • 大きな分析を考える
  • タイマークシステム
  • VMware (EMC の一部)

要求

  • Telecomの業務運用やデータシステムに関する基本的な知識を有していること
  • SQL/Oracleまたはリレーショナルデータベースの基本的な理解を持っていること
  • 統計の基本的な理解(Excelレベル)
 35 時間

参加者の人数



Price per participant

お客様の声 (3)

関連コース

関連カテゴリー