第2次AIブーム(知識の時代)その2 オントロジー

第2次AIブーム(知識の時代)その2 オントロジー AI、データサイエンス

G検定記事はこちら。
https://www.simulationroom999.com/blog/jdla-deep-learning-for-general-2020-1/

はじめに

第2次AIブーム初期に於いてエキスパートシステムによるアプローチが実現された。
しかし、暗黙知の獲得、矛盾点調整の困難さからオントロジーの研究が注目を浴びる。

意味ネットワーク。オントロジー。記述方法論。ヘビーオントロジー。ライトオントロジー。Cycプロジェクト。ウェブマイニング、データマイニング、ワトソン、東ロボくん。IS-a、part-of、推移律

意味ネットワーク

意味ネットワークとは以下の概念構造である。

  • 概念ラベルが付いたノードで表現する。
  • 概念間の関係を矢印で結んだネットワークとする。
  • 関係性はis-apart-ofで表現する。

オントロジー(概念体系を記述する方法論/存在論)

1984年:ダグラス・レナートにより、Cycプロジェクトが発足。
このプロジェクトは、「すべての一般常識をコンピュータへ取り込む」プロジェクト。

オントロジーの目的は「知識の共有と活用」であり、言葉、語彙、意味他の人とも共有できる明確な仕様として定義が必要と考えられた。

概念間の関係性

is-a」と「part-of」が重要な関係性となる。

  • is-a
    • 上位概念下位概念
      • 推移律
        • A>BかつB>CであればA>C
        • ジャンケンでは成立しない
        • 哺乳類is-a動物、人間is-a哺乳類 → 人間is-a動物
  • part-of
    • 全体と部分の関係
      • 日本part-ofアジア、東京part-of日本 → 東京part-ofアジア
        • 一見すると推移律が成立するものもある
      • 指part-of太郎、太郎part-of野球部 → 指part-of野球部????
        • 推移律が成立しない
          • いろいろな種類の関係がある
            • 木part-of森 → 木が一本無くなっても森は森
            • 夫part-of夫婦 → 夫が居なくなると夫婦は成立しない
              • 最低でも5種類の関係がある。
                • これらをコンピュータに理解させるのは困難

オントロジーの構築

オントロジーの構築には大きく2つのアプローチがある。

  • ヘビーウェイトオントロジー
    • 哲学的にしっかり考える
      • Cycプロジェクトが該当
  • ライトウェイトオントロジー
    • 効率重視で可能な限り自動で実施
      • ウェブマイニングデータマイニングが該当
        • セマンティックWEB
        • LOD(Linked Open Data)

第2次AIブームの成果

ワトソン東ロボくんが代表的。

  • ワトソン
    • IBMが開発
    • 2011年、アメリカのクイズ番組で勝利
    • Question-Answering(質問応答)の研究分野の成果
    • Wikipediaの情報を元にライトウェイト・オントロジー
    • 質問に含まれるキーワードと関連しそうな答えを高速検索
    • コールセンター、人材マッチングなどの分野で活用
  • 東ロボくん
    • 2011年プロジェクトスタート
    • 2016年に進研模試で偏差値57.8
    • 読解力に問題あり
      • 質問の意味を理解しているわけでは無いため
        • 2016年に凍結

まとめ

  • オントロジーにより、意味ネットワークが構築され、人の知識に近いものが出来てきた。
  • 第1次AIブームと比べると現実世界に対して影響を持ち始めた時期となる。

コメント

タイトルとURLをコピーしました