コース概要

詳細なトレーニング概要

  1. NLP入門
    • NLPの理解
    • NLPフレームワーク
    • NLPの商業的応用
    • ウェブからのデータスクラピング
    • テキストデータを取得するためのAPIの使用
    • テキストコーパスの作成と保存、コンテンツおよび関連メタデータの保存
    • PythonとNLTKの基本的な使い方の利点
  2. コーパスとデータセットの実践的理解
    • なぜコーパスが必要なのか?
    • コーパス分析
    • データ属性の種類
    • コーパス用の異なるファイル形式
    • NLP応用のためのデータセットの準備
  3. 文の構造の理解
    • NLPのコンポーネント
    • 自然言語理解
    • 形態素解析 - 語幹、単語、トークン、品詞タグ
    • 文法解析
    • 意味解析
    • 曖昧性の処理
  4. テキストデータの前処理
    • コーパス - 生のテキスト
      • 文分割
      • 生のテキストの語幹化
      • 生のテキストの基本形変換
      • ストップワードの除去
    • コーパス - 生の文章
      • 単語分割
      • 単語の基本形変換
    • 項-文書/文書-項行列の作成と使用
    • テキストをn-グラムや文章に分割
    • 実践的かつカスタマイズされた前処理
  5. テキストデータの分析
    • NLPの基本的な特徴
      • パーサーと解析
      • 品詞タグ付けとタガー
      • 固有名詞認識
      • n-グラム
      • 単語の袋
    • NLPの統計的特徴
      • NLP用の線形代数の概念
      • NLP用の確率論
      • TF-IDF
      • ベクトル化
      • エンコーダーとデコーダー
      • 正規化
      • 確率モデル
    • 高度な特徴量エンジニアリングとNLP
      • word2vecの基本概念
      • word2vecモデルのコンポーネント
      • word2vecモデルの論理
      • word2vec概念の拡張
      • word2vecモデルの応用
    • ケーススタディ: 単語の袋の応用 - 単純化されたLuhnアルゴリズムと本物のLuhnアルゴリズムを使用した自動文要約
  6. ドキュメントクラスタリング、分類、トピックモデリング
    • ドキュメントクラスタリングとパターンマイニング (階層的クラスタリング、k-平均法クラスタリングなど)
    • TFIDF、Jaccard距離、コサイン距離などの指標を使用したドキュメントの比較と分類
    • Naïve Bayesと最大エントロピーを使用したドキュメント分類
  7. 重要なテキスト要素の特定
    • 次元削減: 主成分分析、特異値分解、非負行列因子分解
    • 潜在的意味解析を用いたトピックモデリングと情報検索
  8. エンティティ抽出、感情分析、高度なトピックモデリング
    • ポジティブ vs. ネガティブ: 感情の度合い
    • アイテム応答理論
    • 品詞タグ付けとその応用: 文中に登場する人物、場所、組織を見つける
    • 高度なトピックモデリング: 潜在的ディリクレ割り当て (LDA)
  9. ケーススタディ
    • 非構造化ユーザーレビューのマイニング
    • 製品レビューデータの感情分類と可視化
    • 使用パターンのための検索ログのマイニング
    • テキスト分類
    • トピックモデリング

要求

NLPの原理に関する知識と意識、およびビジネスにおけるAI応用への理解

 21 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (1)

今後のコース

関連カテゴリー