我正在了解 Mxnet 框架。在关注此 Linear Regression article 时我看到以下代码正在创建一个密集层:
net = gluon.nn.Dense(1, in_units=2) # input dimension= 2, output dimension = 1
但为什么 print(net.weight)
将形状作为 Parameter dense4_weight (shape=(1, 2), dtype=None)
形状不应该是(2, 1)
吗?
据我了解:
input = Shape(n, 2) where n is number of samples
output = Shape(n, 1)
所以矩阵乘法的权重矩阵应该是 Shape(2, 1),不是吗?
我在这里错过了什么?
最佳答案
这只是由于内部实现。您可以将其视为在乘法之前对权重矩阵进行转置。
关于python - Mxnet - 了解密集层的权重形状,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47477871/