バックナンバーはこちら。
https://www.simulationroom999.com/blog/compare-matlabpythonscilabjulia3-backnumber/
はじめに
今までは、畳み込み演算をベースとした画像処理がメインだった。
今回からはアフィン変換等の座標変換の話に突入する。
登場人物
博識フクロウのフクさん
イラストACにて公開の「kino_k」さんのイラストを使用しています。
https://www.ac-illust.com/main/profile.php?id=iKciwKA9&area=1
エンジニア歴8年の太郎くん
イラストACにて公開の「しのみ」さんのイラストを使用しています。
https://www.ac-illust.com/main/profile.php?id=uCKphAW2&area=1
他の画像処理
画像処理としては、いい感じの2値化ができた感じだね。
まぁ、そこから細かく物体検出やセグメンテーションを行うのだろうが、
昨今はディープラーニングを利用したものが主流だから、
そこを細かく追及しても面白くないし、私もぶっちゃけ説明できないな。
そこらへんの技術発展はすさまじそうだからねぇ。
そういうえば、画像処理というと、図形の変形とかもあるよね?
あれは割と簡単だったりするの?
あー、アフィン変換とかだね。
アフィン変換?
アフィン変換
アフィン変換については、とりあえずWikipediaから引用しよう。
アフィン変換特化の説明は英語版Wikipediaに記載があった。
In Euclidean geometry, an affine transformation or affinity (from the Latin, affinis, “connected with”) is a geometric transformation that preserves lines and parallelism, but not necessarily Euclidean distances and angles.
Wikipediaより(https://en.wikipedia.org/wiki/Affine_transformation)
More generally, an affine transformation is an automorphism of an affine space (Euclidean spaces are specific affine spaces), that is, a function which maps an affine space onto itself while preserving both the dimension of any affine subspaces (meaning that it sends points to points, lines to lines, planes to planes, and so on) and the ratios of the lengths of parallel line segments. Consequently, sets of parallel affine subspaces remain parallel after an affine transformation. An affine transformation does not necessarily preserve angles between lines or distances between points, though it does preserve ratios of distances between points lying on a straight line.
↓日本語化
ユークリッド幾何学では、アフィン変換またはアフィニティ(ラテン語のaffinis、「とつながっている」から)は、直線と平行度を保持する幾何学的変換であるが、必ずしもユークリッドの距離と角度を保持する必要はない。
Wikipediaより(https://en.wikipedia.org/wiki/Affine_transformation)
より一般的には、アフィン変換はアフィン空間(ユークリッド空間は特定のアフィン空間である)の自動多相性である。つまり、アフィン部分空間の次元(点を点に、線を線に、平面を平面に、など)と平行線分の長さの比の両方を保持しながら、アフィン空間をそれ自体に写像する関数である。その結果、平行なアフィン部分空間の集合は、アフィン変換後も平行のままである。アフィン変換は必ずしも直線間の角度や点間の距離を保持するわけではないが、直線上にある点間の距離の比は保持する。
何言ってるかさっぱりわからん・・・。
まぁ、ピクセル単位の座標変換だと思えばOKだな。
x座標、y座標を元にした変換と、そこに対しての並行移動のパラメータがあるって感じだ。
まるで簡単かのような言いっぷりだが、全く意味わからんぞ・・・。
ここでは、
アフィン変換という座標変換手法があって、
現座標を元に直線的に変換先を決定する手法がある。
という認識でOKだ。
細かい話は追々していこう。
(なんど聞いても意味わからん・・・。)
まとめ
まとめだよ。
- 画像処理は、特徴を抽出する畳み込みとは別に座標を変換するものもある。
- 座標変換の代表的な手法としてアフィン変換がある。
- アフィン変換は現座標を元に直線的に変換先を決定する手法。
バックナンバーはこちら。
コメント