第3次AIブーム(機械学習・深層学習の時代)

AI、データサイエンス

G検定記事はこちら。
https://www.simulationroom999.com/blog/jdla-deep-learning-for-general-2020-1/

はじめに

機械学習、ディープラーニング(深層学習)の時代に突入。
昨今のAIによる恩恵の時代。

機械学習、レコメンデーション、スパムフィルタ、統計的自然言語処理、対訳データ、コーパス、ディープラーニング、単純パーセプトロン、マービン・ミンスキー、バックプロバゲーション、自己符号化器、オートエンコーダ、ILSVRC,トロント大学、SuperVision

機械学習

機械学習とは、プログラム自身が学習する仕組みであり、
その学習はサンプルデータが多いほど良い
2000年以降はビッグデータと共に注目を浴びる。
(ビッグデータで大量のサンプルを集められるので相乗効果に期待)

実際の利用シーンは以下。

  • レコメンデーションエンジン
    • ユーザの好みを推測
  • スパムフィルタ
    • 迷惑メール検知
  • 統計的自然言語処理
    • ウェブページ上の文字を扱う研究
    • 複数の単語をひとまとめにした対訳データ(コーパス)を保持
      • 確率的に最も正解なものを選択

ニューラルネットワーク

ニューラルネットワークとは、人間の神経回路を模したものである。
最小単位は単純パーセプトロンと呼ばれ、1958年:フランク・ローゼンブラッドにより考案。
しかし、1969年:マービン・ミンスキーによって、線形分離できる単純問題しか解けないと指摘を受ける。

ディープラーニング

ディープラーニングニューラルネットワークを多層にしたものを指す。
多層であるため、学習精度が上がりにくいという課題があった。
この課題に対して以下2つの対策が存在する。

  • バックプロバゲーション(誤差逆伝播学習法)で克服
  • 自己符号化器
    • 出力が入力と同一になるように学習

ディープラーニングによるブレイクスルー

当時は特徴量を決めるのは人間が一般的であり、かなり職人技を求めらる領域に成りつつあった。
しかし、
2012年、ILSVRC(Imagenet Large Scale Visual Recognition Challenge)という自動画像認識コンテストにて、トロント大学のSuperVisionが圧倒的勝利を収めたことにより、ディープラーニングによる特徴量の自動抽出に焦点があたる。
これにより、それ以降はディープラーニングによる画像認識が主流となる。
この画像認識精度は人間を超える水準になっていった。

まとめ

  • ディープラーニングの元となるニューラルネットワーク自体は第1次AIブーム時から存在していた。
  • バックプロパゲーションなどの学習方法、コンピュータの処理能力、学習するデータ量により一気に進展し、ブレイクスルーへ。

コメント

タイトルとURLをコピーしました