ディープラーニング:自然言語処理(NLP)について


概要

    • Natural・・自然
    • Language・・言語を
    • Processing・・処理する
  • コンピュータ言語に対して自然言語は人間の利用する言葉
    • コンピュータ言語:if、for、class、import、ls、;、{、…
    • 自然言語:flower、花、…
  • 単語に複数の意味がある、文脈によって変わる
    • 生花、造花、華やかさがあること、桜、…
  • 新しい言葉が生まれる
    • ナウい、チョベリバ、草、…
      • なんだか恥ずかしい…
  • 種類色々
    • 日本語、英語、…

コンピュータが単語の意味を理解する

考え方のヒント

  • まずは単語を理解するところから始める
  • 人も周りの言葉からその間の言葉を理解することがある
    • 単語の意味が分からなくても、周りの言葉から想像できる
    • 人はそうやって語彙を増やしていく
  • 周囲の単語から間の単語を予想できるようにAIを学習させる
    • それができればAIが単語の意味を理解したことになる

コンピューターの単語理解①

  • 私は(??)を飲む
    • 〇:水、ジュース、コーヒー、お酒
    • △:野菜(すりおろせば・・)、人(おまじない)
    • ×:車、犬、本
  • これらを経験(AIなら学習)から学ぶ
  • あぁ、水って飲むものなんだ、お酒って飲むものなんだ
  • 飲み物とそうでないものが理解できている

コンピューターの単語理解②

  • 例(二つ目)
  • 私は(??)を飲んで酔った
    • 〇:お酒
    • ×:水、ジュース、コーヒー
  • これらを経験(AIなら学習)から学ぶ
  • あぁ、お酒って飲むもので酔っぱらうんだ
  • 文脈から(を理解して)飲み物の中から選べている

単語を理解したとはどんな状態か?

  • 上の例では学習から単語の意味を理解している
    • 同じ文章でも穴あきの場所を変えてAIに解かせる問題を作る
      • 私はコーヒーを(??)
      • (??)は水を飲む
  • 学習データ
    • 人間の書いた文章有名な人の書いた小説
    • インターネット上の大量の文章
  • 学習が進めば間に入る単語は何か予想できる状態になる
    • 正確にはいくつかの単語が予想上位に来る
    • 最も評価数値(パープレキシティ)が高いものがAIの答えとする


Posted by futa