G検定記事はこちら。
https://www.simulationroom999.com/blog/jdla-deep-learning-for-general-2020-1/
はじめに
G検定シラバス「機械学習の具体的手法」の範囲の対策。
難易度は高。過去問、問題集だけでは不足で、ある程度自分で調べておく必要がある。
※ G検定対策はこちら。
機械学習の手法
上記に加え以下も調べておく必要あり。
- t-SNE(t-distributed Stochastic Neighbor Embedding :t分布型確率的近傍埋め込み)
- 次元削減アルゴリズムの一つ
- 協調フィルタリング
- ユーザの購買履歴からレコメンド
- 内容(コンテンツ)ベースフィルタリング
- アイテムの特徴を元にレコメンド
- 単回帰分析
- 重回帰分析
- 決定木
- 条件分岐
- 情報利得最大 = 不純度減少最大
- サポートベクターマシン(SVM)
- スラッグ変数
- 誤分類を許容する数
- ヒンジ損失関数
- SVMの説明関数
- 単純パーセプトロンで使用されることもある
- スラッグ変数
- KNN法
- 教師ありクラス分類
- データから近い順にk個のデータを見て多数決
- データに偏りがあると不正確になる
- 主成分解析
- 分散が最大になる軸にデータをマップする。
教師ありの分類は数が分かっている既知のクラスへ分類。
教師なしのクラスタリングは数が不明な未知のクラスへ分類。
機械学習の評価手法
L1正則化=ラッソ回帰=スパース正則化
L2正則化=リッジ回帰=ノルムを小さく抑える
まとめ
機械学習の手法は数が多い。
少なくとも教師あり学習、教師なし学習の切り分けができている状態が望ましい。
その上で分類とクラスタリングの違いを認識する必要がある。
※ G検定対策はこちら。
コメント