バックナンバーはこちら。
https://www.simulationroom999.com/blog/compare-matlabpythonscilabjulia3-backnumber/
はじめに
アフィン変換のプログラミング。
今回は、Python(NumPy)で実施。
登場人物
博識フクロウのフクさん

イラストACにて公開の「kino_k」さんのイラストを使用しています。
https://www.ac-illust.com/main/profile.php?id=iKciwKA9&area=1
エンジニア歴8年の太郎くん

イラストACにて公開の「しのみ」さんのイラストを使用しています。
https://www.ac-illust.com/main/profile.php?id=uCKphAW2&area=1
アフィン変換のプログラミングに向けて【再掲】

太郎くん
まずは処理手順の再掲。
- 画像サイズの取得
 - 中心を0とした座標系の生成
- X軸、Y軸ともに-1~1の範囲の座標系として扱う
 
 - 座標\(x\prime,y\prime,1\)の3次元ベクトル配列の生成。
- ※ 全座標に対して一括でアフィン逆変換を実施するため。
 
 - 変換元座標の算出(アフィン逆変換)
 - 画像と同一形状の2次元配列に変換元座標配列を生成。
 - 変換元の座標系-1~1をピクセル位置に変換。
 - 元画像と変換元座標を元に変換先へコピー。
 

フクさん
これをPython(NumPy)で実施する。
Pythonコード

フクさん
Pythonコードは以下になる。
import numpy as np
import cv2
# アフィン変換関数
def affine_transformation(img, matrix):
    # 画像サイズ取得
    hight, width = img.shape
    
    # 中心を0とした座標系を生成
    x_axis = np.linspace(-1, 1, width);
    y_axis = np.linspace(-1, 1, hight);
    xim,yim = np.meshgrid(x_axis, y_axis);
    
    # 座標x,y,1の3次元ベクトルの配列
    # reshapeで行ベクトル化、「*」で式展開
    points=np.array([[*xim.reshape(width*hight)], 
                     [*yim.reshape(width*hight)], 
                     [*np.ones((width*hight))]])
    
    # 変換元座標算出(アフィン逆変換)
    points_affine = matrix @ points;
    
    # 画像と同一形状の2次元配列に変換元座標配列を生成
    dx = points_affine[0,:].reshape(hight,width)
    dy = points_affine[1,:].reshape(hight,width)
    
    # 変換元座標をピクセル位置に変換
    v = np.clip((dx + 1) * width / 2, 0, width-1).astype('i')
    h = np.clip((dy + 1) * hight / 2, 0, hight-1).astype('i')
    
    # 元画像と変換元座標を元に変換先へコピー
    return img[h, v]
# キャンパス拡張
def canvas_expansion(img, x, y):
    H,W=img.shape
    WID=W+x
    HID=H+y
    e_img = np.zeros((HID, WID),dtype='uint8')
    e_img[int((HID-H)/2):int((HID+H)/2), int((WID-W)/2):int((WID+W)/2)] = img;
    img = e_img
    
    return img
def affine_transformation_scaling_test():
    # 入力画像の読み込み
    img = cv2.imread("dog.jpg")
    
    b = img[:,:,0]
    g = img[:,:,1]
    r = img[:,:,2]
    
    # SDTVグレースケール
    img = np.array(0.2990 * r + 0.5870 * g + 0.1140 * b, dtype='uint8')
    
    # キャンパス拡張
    img = canvas_expansion(img, 300, 300)
    
    sx = -1;
    sy = 1.5;
    
    matrix     = np.array([[ sx,   0,  0],
                           [  0,  sy,  0],
                           [  0,   0,  1]])
    matrix = np.linalg.inv(matrix)
    
    # アフィン変換
    affine_img = affine_transformation(img, matrix)
    
    # グレースケール画像の書き込み
    cv2.imwrite("dog_affine_scaling.jpg", affine_img)
    
    return;
affine_transformation_scaling_test()
処理結果

フクさん
処理結果は以下。

考察

太郎くん
これも動作としてはOKだね。
処理の流れもMATLABと一緒か。

太郎くん
気になるポイントとしては以下かな?
# 座標x,y,1の3次元ベクトルの配列
# reshapeで行ベクトル化、「*」で式展開
points=np.array([[*xim.reshape(width*hight)], 
                 [*yim.reshape(width*hight)], 
                 [*np.ones((width*hight))]])

フクさん
これは、リストのアンパックという仕様を利用している。
これをやらないと、配列の次元が期待と異なる結果になる。

太郎くん
どんな感じになるの?

フクさん
3×Nを期待しているところに対して
3×1×Nみたいな配列になる。

太郎くん
なんか間に1とよくわからんのが・・・。

フクさん
アンパック以外にはnp.blockなどを使う手法でもOKだ。
行列の結合パターンは何個かあるから、調べてみるのも良いだろう。
まとめ

フクさん
まとめだよ。
- Python(NumPy)でアフィン変換の伸縮を実施。
- 問題無く動作。
 
 - 配列の次元の辻褄あわせのためリストのアンパック仕様を利用している。
- no.blockなどの行列結合でもOK。
 
 
バックナンバーはこちら。
 



コメント