python - Numpy 方法从卷积核生成线性运算矩阵

标签 python numpy tensorflow vectorization convolution

形状为 (k1, k2, n_channel, n_filter) 的 2D 卷积核 K 适用于 2D 向量 A,形状 (m1, m2, n_channel) 并生成另一个形状 (m1 - k1 + 1, m2 - k2 + 1, n_filter) 的二维向量 B ) (带有有效填充)。

同样,对于每个 K,都存在一个形状为 (m1 - k1 + 1, m2 - k2 + 1, n_filter, m1, m2, n_channel),使得W_KA的张量点等于B。即 B = np.tensordot(W_K, A, 3)

我正在尝试找到一个纯 NumPy 解决方案,在不使用任何 python 循环的情况下从 K 生成此 W_K

我可以看到W_K[i,j,f] == np.pad(K[...,f], ((i,m1-i-k1), (j,m2-j- k2))、'constant'、constant_values=0) 或简单地 W_K[i, j, f, i:i+k1, j:j+k2, ...] == K[. ..,f].

我正在寻找的几乎类似于托普利茨矩阵。但我需要多维度的。

循环代码示例:

import numpy as np

# 5x5 image with 3-channels
A = np.random.random((5,5,3))
# 2x2 Conv2D kernel with 2 filters for A  
K = np.random.random((2,2,3,2))

# It should be of (4,4,2,5,5,3), but I create this way for convenience. I move the axis at the end.
W_K = np.empty((4,4,5,5,3,2))
for i, j in np.ndindex(4, 4):
  W_K[i, j] = np.pad(K, ((i, 5-i-2),(j, 5-j-2), (0, 0), (0, 0)), 'constant', constant_values=0)

# above lines can also be rewritten as
W_K = np.zeros((4,4,5,5,3,2))
for i, j in np.ndindex(4, 4):
  W_K[i, j, i:i+2, j:j+2, ...] = K[...]

W_K = np.moveaxis(W_K, -1, 2)

# now I can do
B = np.tensordot(W_K, A, 3)

最佳答案

你想要的需要一点fancy indexing体操,但编码起来并不是很麻烦。这个想法是创建 4 维索引数组,应用第二个循环示例的 W_K[i, j, i:i+2, j:j+2, ...] 部分。

这是示例的稍微修改版本,只是为了确保一些相关维度有所不同(因为这使错误更容易找到:它们将是正确的错误而不是损坏的值):

import numpy as np

# parameter setup
k1, k2, nch, nf = 2, 4, 3, 2 
m1, m2 = 5, 6 
w1, w2 = m1 - k1 + 1, m2 - k2 + 1 
K = np.random.random((k1, k2, nch, nf)) 
A = np.random.random((m1, m2, nch)) 

# your loopy version for comparison
W_K = np.zeros((w1, w2, nf, m1, m2, nch)) 
for i, j in np.ndindex(w1, w2): 
    W_K[i, j, :, i:i+k1, j:j+k2, ...] = K.transpose(-1, 0, 1, 2) 

W_K2 = np.zeros((w1, w2, m1, m2, nch, nf))  # to be transposed back
i,j = np.mgrid[:w1, :w2][..., None, None]  # shape (w1, w2, 1, 1) 
k,l = np.mgrid[:k1, :k2]  # shape (k1, k2) ~ (1, 1, k1, k2)  

W_K2[i, j, i+k, j+l, ...] = K 
W_K2 = np.moveaxis(W_K2, -1, 2) 

print(np.array_equal(W_K, W_K2))  # True

我们首先创建一个跨越W_K前两个维度的索引网格i,j,然后创建两个跨越其(pre-moveaxis)的相似网格)第二维和第三维。通过将两个尾随单例维度注入(inject)前者,我们最终得到 4d 索引数组,它们一起跨越 W_K 的前四个维度。

剩下的就是使用原始的 K 分配给这个切片,并向后移动维度。由于当表达式中的切片(非高级)索引并非全部相邻时,高级索引会改变行为,因此使用 moveaxis 方法可以更轻松地实现这一点。我首先尝试创建 W_K2 及其最终尺寸,但随后我们会得到 W_K[i, j, :, i+k, j+l, ...] 其行为略有不同(特别是不同的形状)。

关于python - Numpy 方法从卷积核生成线性运算矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57976816/

相关文章:

python - 如何立即在 PyQt 的 textEdit 小部件中获取更改?

python - 如何使用 nix-shell 启用可选的构建依赖项?

python - 将居中切片外的数组值清零

python - 为什么我的 Tensorflow 神经网络在开始训练后表现得如此缓慢?

python - 为数据分析构建 Python 代码

python - TypeError : unhashable type: 'dict' . 列表中的字典

python - 如何从一堆图像中裁剪具有不同位置的相同大小的图像 block ?

python - 如何从 pickle 文件中一次加载一行?

python - 我们应该如何处理name_scope的自动增量?

python - Keras:拟合时使用权重