勾配降下法の動作イメージ
勾配降下法の更新式を確認したが、
実際どういうふう動くかは数式からはわかりにくい。
正直状況によるってところだが、
ざっくりとしては以下2パターンになる。
学習率が小さい場合
(収束に時間がかかる)
学習率が大きい場合
(収束は早いかもしれないが発散の可能性もある。)
学習率の設定で大きく性格がか変わる。
小さすぎても大きすぎてもダメで、ちょうどよさそうなところを頑張って探す必要がある。
このように人間の手で調整していくパラメータであるため、
学習率などはハイパーパラメータと呼ばれる。
パラメータって呼び方だと重みとかバイアスの話になるため、
ハイパーって接頭辞を付けて呼び分けてると思われる。
まとめ
- 勾配降下法の更新式を確認。
- 勾配降下法の動作イメージを確認。
- 学習率が大きい場合と小さい場合で挙動が変わる。
- ちょうど良い学習率を人間の手で探す。
- これにより、一般的なパラメータとは異なるハイパーパラメータというカテゴリになる。
MATLAB、Python、Scilab、Julia比較ページはこちら
Pythonで動かして学ぶ!あたらしい線形代数の教科書
Amazon.co.jp
ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装
Amazon.co.jp
ゼロからはじめるPID制御
https://amzn.to/3SvzuyR
OpenCVによる画像処理入門
https://amzn.to/498ZUgK
恋する統計学[回帰分析入門(多変量解析1)] 恋する統計学[記述統計入門]
Amazon.co.jp
Pythonによる制御工学入門
Amazon.co.jp
理工系のための数学入門 ―微分方程式・ラプラス変換・フーリエ解析
https://amzn.to/3UAunQK
コメント