MATLAB,Python,Scilab,Julia比較 第3章 その74【アフィン変換⑱】

バックナンバーはこちら。
https://www.simulationroom999.com/blog/compare-matlabpythonscilabjulia3-backnumber/

はじめに
登場人物
アフィン変換のプログラミングに向けて【再掲】
Pythonコード
処理結果
考察
まとめ

はじめに

アフィン変換のプログラミング。
今回は、Python(NumPy)で実施。

登場人物

博識フクロウのフクさん

イラストACにて公開の「kino_k」さんのイラストを使用しています。
https://www.ac-illust.com/main/profile.php?id=iKciwKA9&area=1

エンジニア歴8年の太郎くん

イラストACにて公開の「しのみ」さんのイラストを使用しています。
https://www.ac-illust.com/main/profile.php?id=uCKphAW2&area=1

アフィン変換のプログラミングに向けて【再掲】

太郎くん

まずは処理手順の再掲。

画像サイズの取得
中心を0とした座標系の生成
- X軸、Y軸ともに-1～1の範囲の座標系として扱う
座標\(x\prime,y\prime,1\)の3次元ベクトル配列の生成。
- ※ 全座標に対して一括でアフィン逆変換を実施するため。
変換元座標の算出(アフィン逆変換)
画像と同一形状の2次元配列に変換元座標配列を生成。
変換元の座標系-1～1をピクセル位置に変換。
元画像と変換元座標を元に変換先へコピー。

フクさん

これをPython(NumPy)で実施する。

Pythonコード

フクさん

Pythonコードは以下になる。

import numpy as np
import cv2

# アフィン変換関数
def affine_transformation(img, matrix):
    # 画像サイズ取得
    hight, width = img.shape
    
    # 中心を0とした座標系を生成
    x_axis = np.linspace(-1, 1, width);
    y_axis = np.linspace(-1, 1, hight);
    xim,yim = np.meshgrid(x_axis, y_axis);
    
    # 座標x,y,1の3次元ベクトルの配列
    # reshapeで行ベクトル化、「*」で式展開
    points=np.array([[*xim.reshape(width*hight)], 
                     [*yim.reshape(width*hight)], 
                     [*np.ones((width*hight))]])
    
    # 変換元座標算出(アフィン逆変換)
    points_affine = matrix @ points;
    
    # 画像と同一形状の2次元配列に変換元座標配列を生成
    dx = points_affine[0,:].reshape(hight,width)
    dy = points_affine[1,:].reshape(hight,width)
    
    # 変換元座標をピクセル位置に変換
    v = np.clip((dx + 1) * width / 2, 0, width-1).astype('i')
    h = np.clip((dy + 1) * hight / 2, 0, hight-1).astype('i')
    
    # 元画像と変換元座標を元に変換先へコピー
    return img[h, v]

# キャンパス拡張
def canvas_expansion(img, x, y):
    H,W=img.shape
    WID=W+x
    HID=H+y
    e_img = np.zeros((HID, WID),dtype='uint8')
    e_img[int((HID-H)/2):int((HID+H)/2), int((WID-W)/2):int((WID+W)/2)] = img;
    img = e_img
    
    return img

def affine_transformation_scaling_test():
    # 入力画像の読み込み
    img = cv2.imread("dog.jpg")
    
    b = img[:,:,0]
    g = img[:,:,1]
    r = img[:,:,2]
    
    # SDTVグレースケール
    img = np.array(0.2990 * r + 0.5870 * g + 0.1140 * b, dtype='uint8')
    
    # キャンパス拡張
    img = canvas_expansion(img, 300, 300)
    
    sx = -1;
    sy = 1.5;
    
    matrix     = np.array([[ sx,   0,  0],
                           [  0,  sy,  0],
                           [  0,   0,  1]])
    matrix = np.linalg.inv(matrix)
    
    # アフィン変換
    affine_img = affine_transformation(img, matrix)
    
    # グレースケール画像の書き込み
    cv2.imwrite("dog_affine_scaling.jpg", affine_img)
    
    return;


affine_transformation_scaling_test()

処理結果

フクさん

処理結果は以下。

考察

太郎くん

これも動作としてはOKだね。
処理の流れもMATLABと一緒か。

太郎くん

気になるポイントとしては以下かな？

# 座標x,y,1の3次元ベクトルの配列
# reshapeで行ベクトル化、「*」で式展開
points=np.array([[*xim.reshape(width*hight)], 
                 [*yim.reshape(width*hight)], 
                 [*np.ones((width*hight))]])

フクさん

これは、リストのアンパックという仕様を利用している。
これをやらないと、配列の次元が期待と異なる結果になる。

太郎くん

どんな感じになるの？