ディープラーニング:自然言語処理(NLP)について
目次
概要
- 訳
- Natural・・自然
- Language・・言語を
- Processing・・処理する
- コンピュータ言語に対して自然言語は人間の利用する言葉
- コンピュータ言語:if、for、class、import、ls、;、{、…
- 自然言語:flower、花、…
- 単語に複数の意味がある、文脈によって変わる
- 生花、造花、華やかさがあること、桜、…
- 新しい言葉が生まれる
- ナウい、チョベリバ、草、…
- なんだか恥ずかしい…
- ナウい、チョベリバ、草、…
- 種類色々
- 日本語、英語、…
コンピュータが単語の意味を理解する
考え方のヒント
- まずは単語を理解するところから始める
- 人も周りの言葉からその間の言葉を理解することがある
- 単語の意味が分からなくても、周りの言葉から想像できる
- 人はそうやって語彙を増やしていく
- 周囲の単語から間の単語を予想できるようにAIを学習させる
- それができればAIが単語の意味を理解したことになる
コンピューターの単語理解①
- 私は(??)を飲む
- 〇:水、ジュース、コーヒー、お酒
- △:野菜(すりおろせば・・)、人(おまじない)
- ×:車、犬、本
- これらを経験(AIなら学習)から学ぶ
- あぁ、水って飲むものなんだ、お酒って飲むものなんだ
- 飲み物とそうでないものが理解できている
コンピューターの単語理解②
- 例(二つ目)
- 私は(??)を飲んで酔った
- 〇:お酒
- ×:水、ジュース、コーヒー
- これらを経験(AIなら学習)から学ぶ
- あぁ、お酒って飲むもので酔っぱらうんだ
- 文脈から(を理解して)飲み物の中から選べている
単語を理解したとはどんな状態か?
- 上の例では学習から単語の意味を理解している
- 同じ文章でも穴あきの場所を変えてAIに解かせる問題を作る
- 私はコーヒーを(??)
- (??)は水を飲む
- 同じ文章でも穴あきの場所を変えてAIに解かせる問題を作る
- 学習データ
- 人間の書いた文章有名な人の書いた小説
- インターネット上の大量の文章
- 学習が進めば間に入る単語は何か予想できる状態になる
- 正確にはいくつかの単語が予想上位に来る
- 最も評価数値(パープレキシティ)が高いものがAIの答えとする
