お問い合わせを送信いただきありがとうございます!当社のスタッフがすぐにご連絡いたします。
予約を送信いただきありがとうございます!当社のスタッフがすぐにご連絡いたします。
コース概要
詳細なトレーニングアウトライン
- NLPの紹介
- NLPの理解
- NLPフレームワーク
- NLPの商業的応用
- Webからのデータ収集
- テキストデータを取得するための各種APIの使用方法
- コンテンツおよび関連メタデータを保存してテキストコーパスを操作および保存する方法
- PythonおよびNLTKの利点の概要コース
- コーパスとデータセットの実用的な理解
- コーパスが必要な理由
- コーパス分析
- データ属性の種類
- コーパスの様々なファイル形式
- NLPアプリケーション向けのデータセットの準備
- 文の構造の理解
- NLPの構成要素
- 自然言語理解
- 形態素解析 - ステム、単語、トークン、品詞タグ
- 構文解析
- 意味解析
- 曖昧さへの対応
- テキストデータの事前処理
- コーパス - 生テキスト
- 文トークン化
- 生テキストのステミング
- 生テキストのレンマ化
- ストップワードの除去
- コーパス - 生文
- 単語トークン化
- 単語のレンマ化
- TERM-DOCUMENT/DOCUMENT-TERM行列の操作
- n-グラムおよび文へのテキストトークン化
- 実践的かつカスタマイズされた前処理
- コーパス - 生テキスト
- テキストデータの分析
- NLPの基本的特徴
- パーサーと構文解析
- 品詞タグ付けとタグ付けツール
- 固有表現認識
- n-グラム
- ボウ・オブ・ワード(Bag of Words)
- NLPの統計的特徴
- NLPのための線形代数の概念
- NLPのための確率理論
- TF-IDF
- ベクトル化
- エンコーダーとデコーダー
- 正規化
- 確率モデル
- 高度な特徴エンジニアリングとNLP
- word2vecの基礎
- word2vecモデルの構成要素
- word2vecモデルの論理
- word2vec概念の拡張
- word2vecモデルの応用
- ケーススタディ:ボウ・オブ・ワードの応用:簡略化された真のルーンアルゴリズムを用いた自動テキスト要約
- NLPの基本的特徴
- 文書のクラスターリング、分類、およびトピックモデリング
- 文書のクラスターリングとパターンマイニング(階層的クラスターリング、k-means、クラスターリングなど)
- TFIDF、ジャカード係数、コサイン距離測定を用いた文書の比較と分類
- ナイーブベイズと最大エントロピーを用いた文書分類
- 重要なテキスト要素の特定
- 次元削減:主成分分析、特異値分解、非負値行列分解
- 潜在意味分析を用いたトピックモデリングと情報検索
- エンティティ抽出、感情分析、および高度なトピックモデリング
- ポジティブvs.ネガティブ:感情の度合い
- 項目応答理論
- 品詞タグ付けとその応用:テキスト内で言及されている人物、場所、組織の特定
- 高度なトピックモデリング:潜在ディリクレ配分法
- ケーススタディ
- 構造化されていないユーザーレビューのマイニング
- 商品レビューデータの感情分類と可視化
- 検索ログのマイニングによる利用パターン分析
- テキスト分類
- トピックモデリング
要求
NLPの原則に関する知識と理解、およびビジネスにおけるAIの応用に対する理解
21 時間
お客様の声 (1)
個別のサポート
Simon the 2nd - Cboost
コース - ROS: Programming for Robotics
機械翻訳