MATLAB,Python,Scilab,Julia比較 第4章 その6【形式ニューロン④】

バックナンバーはこちら。
https://www.simulationroom999.com/blog/compare-matlabpythonscilabjulia4-backnumber/

はじめに
登場人物
【再掲】形式ニューロンへ至る道
代表的な誤差関数
まとめ

はじめに

形式ニューロンについての解説。
今回は誤差関数について説明。

登場人物

博識フクロウのフクさん

イラストACにて公開の「kino_k」さんのイラストを使用しています。
https://www.ac-illust.com/main/profile.php?id=iKciwKA9&area=1

エンジニア歴8年の太郎くん

イラストACにて公開の「しのみ」さんのイラストを使用しています。
https://www.ac-illust.com/main/profile.php?id=uCKphAW2&area=1

【再掲】形式ニューロンへ至る道

太郎くん

まずは、形式ニューロンへ至る道を再掲。

ヘヴィサイド関数(済)
形式ニューロン(済)
分類問題のHelloWorld(済)
誤差関数
決定境界直線
決定境界直線の特定方法
総当たり法による分類

フクさん

今回は誤差関数について説明する。

代表的な誤差関数

太郎くん

誤差関数って、目的の結果と実際の推論の差で
0になればOKってやつだっけ？
以前の回帰分析とかでそんな話があった気がする。

フクさん

回帰の場合は、0になる点を特定するという発想だったが、
分類問題置いては必ず0の点が見つかるとは限らない。
よって、可能な限り誤差関数の結果が小さいところを最適解する。
って考え方になるな。

太郎くん

扱いがちょっと違うのか。

フクさん

とりあえず、代表的な誤差関数を紹介しておこう。

平均二乗誤差(MSE:Mean Squared Error)

\(
\begin{eqnarray}
MSE&=&\displaystyle\frac{1}{n}\sum_{i=1}^n(\hat{y_i}-y_i)^2\\
&=&\frac{1}{データ数}\sum_{i=0}^n(予測値_{i番目}-正解値_{i番目})^2
\end{eqnarray}
\)

二乗和誤差関数(SSE:Sum of Squared Error)

\(
\begin{eqnarray}
SSE&=&\displaystyle\sum_{i=1}^n(\hat{y_i}-y_i)^2\\
&=&\sum_{i=0}^n(予測値_{i番目}-正解値_{i番目})^2
\end{eqnarray}
\)

二乗平均平方根誤差(RMSE:Root Mean Squared Error)

\(
\begin{eqnarray}
RMSE&=&\displaystyle\sqrt{\frac{1}{n}\sum_{i=1}^n(\hat{y_i}-y_i)^2}\\
&=&\sqrt{\frac{1}{データ数}\sum_{i=0}^n(予測値_{i番目}-正解値_{i番目})^2}
\end{eqnarray}
\)

フクさん

今回使用するのはMSE。
これは、計算式的に分散と一緒。
統計学として意味のある誤差の値になる。
という性質がある。

フクさん

SSEは、回帰分析で使用したものだな。
\(SSE=\displaystyle\frac{1}{2}\sum_{i=1}^n(\hat{y_i}-y_i)^2\)
のように変形したものが
使用される場合もある。
微分した際に1/2が消えてくれて数式がきれいになり、
シンプルなため数学的テクニックを盛り込みやすい。

フクさん

RMSEはMSEよりも値が小さくなり、
学習という面では不利だが、
標準偏差の位置づけとなり、
人間から見て意味のある数値になりやすい。

太郎くん

なんか、似たような感じだけど、それぞれ性質とか目的が違うんだね。

フクさん

これら以外にも大量にあるが、基本は、予測値と正解値の差を評価したいという意味では一緒だな。