お問い合わせ

コース概要

詳細なトレーニングアウトライン

  1. NLPの紹介
    • NLPの理解
    • NLPフレームワーク
    • NLPの商業的応用
    • Webからのデータ収集
    • テキストデータを取得するための各種APIの使用方法
    • コンテンツおよび関連メタデータを保存してテキストコーパスを操作および保存する方法
    • PythonおよびNLTKの利点の概要コース
  2. コーパスとデータセットの実用的な理解
    • コーパスが必要な理由
    • コーパス分析
    • データ属性の種類
    • コーパスの様々なファイル形式
    • NLPアプリケーション向けのデータセットの準備
  3. 文の構造の理解
    • NLPの構成要素
    • 自然言語理解
    • 形態素解析 - ステム、単語、トークン、品詞タグ
    • 構文解析
    • 意味解析
    • 曖昧さへの対応
  4. テキストデータの事前処理
    • コーパス - 生テキスト
      • 文トークン化
      • 生テキストのステミング
      • 生テキストのレンマ化
      • ストップワードの除去
    • コーパス - 生文
      • 単語トークン化
      • 単語のレンマ化
    • TERM-DOCUMENT/DOCUMENT-TERM行列の操作
    • n-グラムおよび文へのテキストトークン化
    • 実践的かつカスタマイズされた前処理
  5. テキストデータの分析
    • NLPの基本的特徴
      • パーサーと構文解析
      • 品詞タグ付けとタグ付けツール
      • 固有表現認識
      • n-グラム
      • ボウ・オブ・ワード(Bag of Words)
    • NLPの統計的特徴
      • NLPのための線形代数の概念
      • NLPのための確率理論
      • TF-IDF
      • ベクトル化
      • エンコーダーとデコーダー
      • 正規化
      • 確率モデル
    • 高度な特徴エンジニアリングとNLP
      • word2vecの基礎
      • word2vecモデルの構成要素
      • word2vecモデルの論理
      • word2vec概念の拡張
      • word2vecモデルの応用
    • ケーススタディ:ボウ・オブ・ワードの応用:簡略化された真のルーンアルゴリズムを用いた自動テキスト要約
  6. 文書のクラスターリング、分類、およびトピックモデリング
    • 文書のクラスターリングとパターンマイニング(階層的クラスターリング、k-means、クラスターリングなど)
    • TFIDF、ジャカード係数、コサイン距離測定を用いた文書の比較と分類
    • ナイーブベイズと最大エントロピーを用いた文書分類
  7. 重要なテキスト要素の特定
    • 次元削減:主成分分析、特異値分解、非負値行列分解
    • 潜在意味分析を用いたトピックモデリングと情報検索
  8. エンティティ抽出、感情分析、および高度なトピックモデリング
    • ポジティブvs.ネガティブ:感情の度合い
    • 項目応答理論
    • 品詞タグ付けとその応用:テキスト内で言及されている人物、場所、組織の特定
    • 高度なトピックモデリング:潜在ディリクレ配分法
  9. ケーススタディ
    • 構造化されていないユーザーレビューのマイニング
    • 商品レビューデータの感情分類と可視化
    • 検索ログのマイニングによる利用パターン分析
    • テキスト分類
    • トピックモデリング

要求

NLPの原則に関する知識と理解、およびビジネスにおけるAIの応用に対する理解

 21 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (1)

今後のコース

関連カテゴリー