我的张量大小为:
a.shape
=> (8, 8)
b.shape
=> (4, 8, 2)
c = a @ b
c.shape
=> (4, 8, 2)
我很惊讶地发现 a @ b
是可以广播的。我检查了 pytorch 的广播规则,似乎这些规则不兼容。
有人可以说明一下这是如何计算的吗?
最佳答案
查看 torch.matmul 的文档
在本例中,b
被解释为批处理矩阵,第一个轴是批处理维度。
关于numpy - Torch 广播如何为 (8, 8) @ (4, 8, 2) 工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/77299241/