バックナンバーはこちら。
https://www.simulationroom999.com/blog/compare-matlabpythonscilabjulia3-backnumber/
はじめに
これから第3章をスタート。
内容としては画像処理がメインのシリーズとなる。
グレースケールから始まり、畳み込み、アフィン変換、射影変換を取り扱う予定。
登場人物
博識フクロウのフクさん
イラストACにて公開の「kino_k」さんのイラストを使用しています。
https://www.ac-illust.com/main/profile.php?id=iKciwKA9&area=1
エンジニア歴8年の太郎くん
イラストACにて公開の「しのみ」さんのイラストを使用しています。
https://www.ac-illust.com/main/profile.php?id=uCKphAW2&area=1
これから何をするのか
これから第3章がスタートだね。
第2章の最後で、画像処理関連をやるようなことを言ってたけど、
具体的には何をするの?
まぁ、大雑把には以下をやる予定だ。
- 画像の読み込み、保存
- グレースケール
- 畳み込み
- アフィン変換
- 射影変換
畳み込みって、畳み込みニューラルネットワークとかで聞く畳み込み?
まぁ、同じものと言えば同じものだな。
畳み込みニューラルネットワークは、多チャンネルにしたり、ストライド幅を調整したり、
畳み込み後に全結合層で分類を行ったりともっと複雑なことをやっているが、
今回やる予定の畳み込みが基本とはなっている。
ようわからんけど、流行りものの基本的なものだと思うとモチベーションあがるねー。
とはいっても、そのあとのアフィン変換、射影変換がわからんのだけど・・・。
その2つは座標変換だな。
画像の拡大縮小回転のようなことをやると思えば良い。
畳み込みニューラルネットワークでも、全結合層の入力寄りの層が暗黙的にやってる処理ともいえるかもね。
ようわからんけど、畳み込みニューラルネットワークの基礎的な位置づけの概念をやるってイメージかな。
そう思ってもらっても差し支えは無いだろう。
直近の予定
で、直近としては、まずは画像の読み込み、保存ってことになるのだけど、
画像のフォーマットはどうなるの?
bmp、jpg、pngとかいろいろあるけど。
結論から言うとどれでもOK。
各ツール、各言語が様々な画像ファイルフォーマットに対応しているので、
我々はあまりそこを気にする必要がない。
まぁ、あまりにも特殊なフォーマットだとできないものあるかもしれないけど。
基本的にはjpg画像を扱うつもりだ。
これなら未対応なことはないだろう。
なるほど。
もうある程度目途は立ってるってことか。
で、各ツール、各言語は今まで通り、
MATLAB、Python、Scilab、Juliaってことで良いのかな?
そうだね。
まぁ、中にはそのツール、言語が苦手なものもあるかもしれないから、
そういう場合は、代替案やそもそもやらないとかは発生するかもしれないけど。
まぁ、純粋なベクトル、行列の世界なら差はそれほどないかもしれないけど、
今回は画像を扱う都合、そういうことは発生してもおかしくないのか。
そうそう。
まとめ
まとめだよ。
- 第3章スタート。
- 畳み込み、アフィン変換、射影変換をやる予定。
- 地味に畳み込みニューラルネットワークの基礎知識になり得るかも。
- 恒例のMATLAB、Python、Scilab、Juliaで動作させてみる予定。
- 内容によっては苦手なもの、できないものが発生するかも。
バックナンバーはこちら。
コメント