https://www.simulationroom999.com/blog/jdla-deep-learning-for-general-2020-1/
はじめに
ディープラーニングの研究分野である、音声認識と強化学習について記載する。
音声認識
RNNの聴覚、音声分野の成果としてWaveNet(ウェーブネット)が存在する。
WaveNetは音声合成(Speech synthesis)と音声認識(Speech recognition)の両方を行えるモデル。
強化学習
強化学習(Reinforcement Learning:RL)の応用はDQN(Deep Q Networks)以降、多数存在。
強化学習の改善手法は以下3つであり、これらすべてを導入したモデルがRAINBOWとなる。
- 方策(ポリシー)ベース(UNREAL)
- 行動/状態価値関数ベース(Q関数ベース)
- モデルベース(A3C)
まとめ
- やや発展中の領域
- 強化学習はセルフプレイにより、無限に強化される可能性を持っている。
コメント