【ディープラーニングG検定対策】機械学習の具体的手法

【ディープラーニングG検定対策】機械学習の具体的手法 G検定

G検定記事はこちら。
https://www.simulationroom999.com/blog/jdla-deep-learning-for-general-2020-1/

はじめに

G検定シラバス「機械学習の具体的手法」の範囲の対策。
難易度は高。過去問、問題集だけでは不足で、ある程度自分で調べておく必要がある。

※ G検定対策はこちら。

機械学習の手法

上記に加え以下も調べておく必要あり。

  • t-SNE(t-distributed Stochastic Neighbor Embedding :t分布型確率的近傍埋め込み)
    • 次元削減アルゴリズムの一つ
  • 協調フィルタリング
    • ユーザの購買履歴からレコメンド
  • 内容(コンテンツ)ベースフィルタリング
    • アイテムの特徴を元にレコメンド
  • 単回帰分析
  • 重回帰分析
  • 決定木
    • 条件分岐
    • 情報利得最大 = 不純度減少最大
  • サポートベクターマシン(SVM)
    • スラッグ変数
      • 誤分類を許容する数
    • ヒンジ損失関数
      • SVMの説明関数
      • 単純パーセプトロンで使用されることもある
  • KNN法
    • 教師ありクラス分類
    • データから近い順にk個のデータを見て多数決
    • データに偏りがあると不正確になる
  • 主成分解析
    • 分散が最大になる軸にデータをマップする。

教師ありの分類は数が分かっている既知のクラスへ分類。
教師なしのクラスタリングは数が不明な未知のクラスへ分類。

機械学習の評価手法

L1正則化=ラッソ回帰=スパース正則化
L2正則化=リッジ回帰=ノルムを小さく抑える

まとめ

機械学習の手法は数が多い。
少なくとも教師あり学習、教師なし学習の切り分けができている状態が望ましい。
その上で分類とクラスタリングの違いを認識する必要がある。

※ G検定対策はこちら。

コメント

タイトルとURLをコピーしました