python - 如何理解外行的 numpy strides?

标签 python numpy scipy stride

我目前正在研究 numpy,在 numpy 中有一个主题叫做“strides”。我明白那是什么。但是它是如何工作的呢?我没有在网上找到任何有用的信息。谁能让我通俗易懂地理解一下?

最佳答案

numpy 数组的实际数据存储在称为数据缓冲区的同类且连续的内存块中。有关详细信息,请参阅 NumPy internals . 使用(默认)row-major顺序,二维数组如下所示:

enter image description here

为了将多维数组的索引 i、j、k、... 映射到数据缓冲区中的位置(偏移量,以字节为单位),NumPy 使用步幅 的概念。 步幅是为了沿着数组的每个方向/维度从一个项目到达下一个项目而在内存中跳过的字节数。换句话说,它是每个维度的连续项目之间的字节分隔。

例如:

>>> a = np.arange(1,10).reshape(3,3)
>>> a
array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

这个二维数组有两个方向,轴 0(垂直向下跨行)和轴 1(水平跨列),每个项目的大小:

>>> a.itemsize  # in bytes
4  

因此,从 a[0, 0] -> a[0, 1](沿第 0 行水平移动,从第 0 列到第 1 列)的字节步进数据缓冲区为 4。同样适用于 a[0, 1] -> a[0, 2]a[1, 0] -> a[1, 1] 等。这意味着水平方向(axis-1)的步幅数为 4 个字节。

但是,要从 a[0, 0] -> a[1, 0](沿第 0 列垂直移动,从第 0 行到第 1 行),您首先需要遍历第 0 行剩余的所有项目到达第 1 行,然后移动第 1 行到达项目 a[1, 0],即 a[0 , 0] -> a[0, 1] -> a[0, 2] -> a[1, 0]。因此,垂直方向(轴 0)的步幅数为 3*4 = 12 个字节。请注意,从 a[0, 2] -> a[1, 0],通常是从第 i 行的最后一项到第 (i+1) 行的第一项-th 行,也是 4 个字节,因为数组 a 以行优先顺序存储。

这就是为什么

>>> a.strides  # (strides[0], strides[1])
(12, 4)  

这是另一个示例,显示二维数组在水平方向(轴 1)上的步幅 strides[1] 不一定等于项目大小(例如,具有列的数组-主要订单):

>>> b = np.array([[1, 4, 7],
                  [2, 5, 8],
                  [3, 6, 9]]).T
>>> b
array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

>>> b.strides
(4, 12)

此处 strides[1] 是项目大小的倍数。尽管数组 b 看起来与数组 a 相同,但它们是不同的数组:在内部 b 存储为 |1|4| 7|2|5|8|3|6|9|(因为转置不会影响数据缓冲区,只会交换步幅和形状),而 a|1|2|3|4|5|6|7|8|9|。让他们看起来相似的是不同的步伐。也就是说,b[0, 0] -> b[0, 1] 的字节步长为 3*4=12 字节,b[0, 0] -> b [1, 0] 是 4 个字节,而对于 a[0, 0] -> a[0, 1] 是 4 个字节,对于 a[0, 0] -> a[1, 0] 是 12 个字节。

最后但同样重要的是,NumPy 允许创建现有数组的 View ,并可选择修改步幅和形状,请参阅 stride tricks .例如:

>>> np.lib.stride_tricks.as_strided(a, shape=a.shape[::-1], strides=a.strides[::-1])
array([[1, 4, 7],
       [2, 5, 8],
       [3, 6, 9]])

相当于转置数组a

让我补充一点,但不涉及太多细节,甚至可以定义不是项目大小倍数的步幅。这是一个例子:

>>> a = np.lib.stride_tricks.as_strided(np.array([1, 512, 0, 3], dtype=np.int16), 
                                        shape=(3,), strides=(3,))
>>> a
array([1, 2, 3], dtype=int16)

>>> a.strides[0]
3

>>> a.itemsize
2

关于python - 如何理解外行的 numpy strides?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53097952/

相关文章:

python - 如何得到两个矩阵的乘积?

python - 如何在python中更改对象的方法

Numpy 在 windows 和 unix 上返回不同的结果

python - 使用 scipy.interpolate.splrep 函数

python-3.x - scipy.optimize.minimize : Iteration limit exceeded

python - 如何使用 SciPy 仅返回模式

python - 将数据作为参数或文件从 python 发送到 c++?

python - 如何在 python 中为一个 if 语句设置多个条件

python - 如何处理巨大的 numpy 数组的计算以避免内存分配错误?

python - 计算wav文件FFT时遇到的问题