ディープラーニングの研究分野 その3

ディープラーニングの研究分野 その3 AI、データサイエンス


https://www.simulationroom999.com/blog/jdla-deep-learning-for-general-2020-1/

はじめに

ディープラーニングの研究分野である、音声認識と強化学習について記載する。

WaveNet、出力層、隠れ層、入力層、強化学習、方策(ポリシー)ベース(UNREAL)、行動/状態価値関数ベース(Q関数ベース)、モデルべーズ(A3C)、報酬、行動、状態、環境、モデル学習、環境モデル、経験の模倣(プラン更新)

音声認識

RNNの聴覚、音声分野の成果としてWaveNet(ウェーブネット)が存在する。
WaveNetは音声合成(Speech synthesis)音声認識(Speech recognition)の両方を行えるモデル。

強化学習

強化学習(Reinforcement Learning:RL)の応用はDQN(Deep Q Networks)以降、多数存在。
強化学習の改善手法は以下3つであり、これらすべてを導入したモデルがRAINBOWとなる。

  • 方策(ポリシー)ベース(UNREAL)
  • 行動/状態価値関数ベース(Q関数ベース)
  • モデルベース(A3C)

まとめ

  • やや発展中の領域
  • 強化学習はセルフプレイにより、無限に強化される可能性を持っている。

コメント

タイトルとURLをコピーしました