コース概要

詳しい研修概要

    NLP の概要 NLP NLP フレームワークを理解する NLP の商用アプリケーション Web からデータをスクレイピングする さまざまな API を使用してテキスト データを取得する テキスト コーパスを操作して保存し、コンテンツと関連するメタデータを保存する Python と NLTK 短期集中コースを使用する利点 コーパスとデータセットの実践的な理解 理由コーパスは必要ですか?コーパス分析 データ属性の種類 コーパスのさまざまなファイル形式 NLP アプリケーション用のデータセットの準備 文の構造の理解 NLP のコンポーネント 自然言語の理解 形態素分析 - 語幹、単語、トークン、音声タグ 構文分析 意味分析 曖昧さの処理 テキスト データの前処理 コーパス- 生のテキスト文のトークン化 生のテキストのステミング 生のテキストの見出し語化 ストップワードの削除 コーパス生の文 Word トークン化 Word 見出し語化 用語-文書/文書-用語行列の操作 n-gram および文へのテキストのトークン化 実用的でカスタマイズされた前処理テキスト データの分析 NLP パーサーと解析の基本機能 POS のタグ付けとタガー 名前エンティティ認識 N グラム Bag of Words NLP の統計的特徴 NLP の線形代数の概念 NLP の確率理論 TF-IDF ベクトル化エンコーダーとデコーダー 正規化 確率モデル 高度な特徴エンジニアリングword2vec と NLP word2vec の基礎 word2vec モデルのコンポーネント word2vec モデルのロジック word2vec 概念の拡張 word2vec モデルの応用 ケーススタディ: バッグ オブ ワードの応用: 単純化された真のルーンアルゴリズムを使用した自動テキスト要約 ドキュメント クラスタリング、分類、およびトピック モデリング ドキュメント クラスタリングおよびパターンマイニング (階層的クラスタリング、K 平均法、クラスタリングなど) TFIDF、Jaccard、コサイン距離測定を使用したドキュメントの比較と分類 ナイーブ ベイズと最大エントロピーを使用したドキュメントの分類 重要なテキスト要素の特定 次元の削減: 主成分分析、特異値分解非負行列分解 潜在意味分析を使用したトピック モデリングと情報検索 エンティティ抽出、感情分析、および高度なトピック モデリング ポジティブとネガティブ: 感情の度合い 項目応答理論 品詞タグ付けとその応用: で言及されている人、場所、組織の検索テキスト 高度なトピック モデリング: 潜在ディリクレ配分 ケース スタディ 非構造化ユーザー レビューのマイニング 製品レビュー データの感情分類と視覚化 使用パターンの検索ログのマイニング テキスト分類 トピック モデリング

要求

NLPの原理に関する知識と認識、およびビジネスにおけるAIの応用に関する理解

  21 時間

参加者の人数


開始

完了


Dates are subject to availability and take place between 10:00 and 17:00.

Price per participant

お客様の声 (2)

関連コース

Smart Robots for Developers

  84 時間