我在理解 numpy 点函数和广播背后的工作时遇到问题。下面是我试图理解的片段
a=np.array([[1,2],[3,5]])
如果我们检查 a 的形状
a.shape
它将是 (2,2)
b=np.array([3,6])
b.shape 是 (2,)
问题1:b
是列向量还是行向量?在提供输入时,它似乎 b
是行向量,但形状将其显示为具有 2 行的列向量。我的理解有什么问题?
现在如果做
a.dot(b)
它导致
数组([15,39])
问题 2:根据矩阵乘法,如果 a
是 m*n
那么 b
必须是 n*k
因为 a
是 2*2,所以 b
必须是 2*1。这是否验证 b
是一个列向量,否则如果它是一个行向量,则矩阵乘法是不可能的,但考虑到 ,点积的输出确实根据矩阵乘法给出了值>b
作为列向量并广播它
现在 b.dot(a)
也是可能的,结果是
数组([21,36])
和
这让我大吃一惊。他们如何检查矩阵乘法向量的兼容性以及他们如何计算?
在至少一种情况下,他们必须抛出乘法不兼容维度的错误。但它没有显示,他们正在计算这两种情况下的结果。
最佳答案
numpy 的编程方式意味着一维数组 shape=(n,)
被视为既不列向量也不是行向量,但可以 < strong>表现基于点积中的位置。为了更好地解释这一点,请考虑将非对称数组的情况与对称数组的情况进行比较:
>>>a=numpy.arange(3)
>>>a.shape=(1,3)
>>>a
array([0,1,2])
>>>b=numpy.arange(9)
>>>b.shape=(3,3)
>>>b
array([0,1,2]
[3,4,5]
[6,7,8])
然后定义一个(3,)向量:
>>>c=numpy.arange(3)
>>>c
array([0,1,2])
>>>c.shape
(3,)
在正常的线性代数中,如果 c 是一个列向量,我们希望 a.c 是一个常量,1x3 矩阵点和 3x1 列向量,c.a 产生一个 3x3 矩阵,3x1 列乘以 1x3 行。在 python 中这样做你会发现 a.dot(c)
会产生一个 (1,) 数组(我们期望的常量),但是 c.dot(a)
将引发错误:
>>>d=a.dot(c)
d.shape=(1,)
>>>e=c.dot(a)
ValueError: shapes (3,) and (1,3) not aligned: 3 (dim 0) != 1 (dim 0)
出了问题的是 numpy 根据 a 的第一个维度检查了 c 的唯一 维度,而不是根据 a 检查了 c 的最后 维度。根据 numpy 一维数组只有一维,所有检查都是针对该维进行的。因此,我们发现一维数组并不严格充当列或行向量。例如。 b.dot(c)
根据 c 的一维检查 b 的第二维(c 行为 类似于列向量)和 c.dot(b)
根据 b 的第一维检查 c 的一维(c 充当 像一个行向量)。因此,它们都有效:
>>>f=b.dot(c)
>>>f
array([ 5, 14, 23])
>>>g=c.dot(b)
>>>g
array([15, 18, 21])
为避免这种情况,您必须为数组提供第二个维度,使其成为行或列向量。在这个例子中,你会明确地说 c.shape=(3,1)
用于列向量或 c.shape=(1,3)
用于行向量。
>>>c.shape=(3,1)
>>>c.dot(a)
array([0,0,0]
[0,1,2]
[0,2,4])
>>>h=c.dot(b)
ValueError: shapes (3,1) and (3,3) not aligned: 1 (dim 1) != 3 (dim 0)
>>>c.shape=(1,3)
>>>i=c.dot(b)
>>>i
array([[15, 18, 21]])
要点是: 根据numpy,行向量和列向量有两个维度
关于python - 向量和数组的 np array 点积,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43232938/