python - "InvalidArgumentError: Incompatible shapes: [64,40000] vs. [64] [Op:Mul]"在张量之间进行运算时?

标签 python tensorflow neural-network layer tensor

我正在尝试在两个张量之间执行此操作:

green_mat = sio.loadmat('green.mat')
green = np.array(green_mat['G2'])
green = tf.convert_to_tensor(green)
green = tf.cast(green, dtype='complex64')  # >>>green.shape = TensorShape([64, 40000])



tensor = tf.ones(128,1)        # tensor.shape = TensorShape([128])

def mul_and_sum(tensor):
   real = tensor[0:64]
   imag = tensor[64:128]
   complex_tensor = tf.complex(real, imag)
   return tf.reduce_sum((tf.multiply(green, complex_tensor), 1))

res = mul_and_sum(tensor)

基本上,最后我想要获得的是一个具有 40000 个元素的张量,用作神经网络的层,但是当我运行此函数作为测试时,出现以下错误:

tensorflow.python.framework.errors_impl.InvalidArgumentError: Incompatible shapes: [64,40000] vs. [64] [Op:Mul]

这是我第一次进行张量运算,也许我对如何处理维度有点困惑,有什么建议吗?谢谢:)

编辑:好的,我已经理解了这一点,确实对于我提供的一切正常的示例,但是我的网络中还有另一个问题:

def convolution(tensor):
tf.cast(tensor, dtype='float64')
real = tensor[0:64]
imag = tensor[64:128]
complex_tensor = tf.complex(real, imag)
a = tf.math.real(tf.reduce_sum((tf.multiply(green, complex_tensor)), 0))
return a

def get_model3(mask_kind):
epochs = 200
learning_rate = 0.1
decay_rate = learning_rate / epochs
inp_1 = keras.Input(shape=(64, 101, 129), name="RST_inputs")
x = layers.Conv2D(1, kernel_size=(1, 1), strides=(1, 1), padding="valid", trainable=False)(inp_1)
x = layers.Conv2D(256, kernel_size=(3, 3), kernel_regularizer=l2(1e-6), strides=(3, 3), padding="same")(x)
x = layers.LeakyReLU(alpha=0.3)(x)
x = layers.Conv2D(128, kernel_size=(3, 3), kernel_regularizer=l2(1e-6), strides=(3, 3), padding="same")(x)
x = layers.LeakyReLU(alpha=0.3)(x)
x = layers.Conv2D(64, kernel_size=(2, 2), kernel_regularizer=l2(1e-6), strides=(2, 2), padding="same")(x)
x = layers.LeakyReLU(alpha=0.3)(x)
x = layers.Conv2D(32, kernel_size=(2, 2), kernel_regularizer=l2(1e-6), strides=(2, 2), padding="same")(x)
x = layers.LeakyReLU(alpha=0.3)(x)
x = layers.Flatten()(x)
x = layers.Dense(512)(x)
x = layers.LeakyReLU(alpha=0.3)(x)
x = layers.Dense(256)(x)
x = layers.LeakyReLU(alpha=0.3)(x)
out1 = layers.Dense(128, name="ls_weights")(x)

if mask_kind == 1:
    binary_mask = layers.Lambda(mask_layer1, name="lambda_layer", dtype='float64')(out1)
elif mask_kind == 2:
    binary_mask = layers.Lambda(mask_layer2, name="lambda_layer", dtype='float64')(out1)
else:
    binary_mask = out1
#here the binary mask shape is [?,128]
binary_mask = tf.expand_dims(binary_mask, axis=2)  #here the shape is [?,128,1]
binary_mask = tf.squeeze(binary_mask, axis=0) #here the shape is [128,1]

print('binary shape:', binary_mask.shape)

lambda_layer = layers.Lambda(convolution, name="convolutional_layer")(binary_mask)
print(lambda_layer.shape)


model3 = keras.Model(inp_1,  lambda_layer, name="2_out_model")

model3.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=decay_rate),  # in caso
               # rimettere 0.001
               loss="mean_squared_error")

plot_model(model3, to_file='model.png', show_shapes=True, show_layer_names=True)
model3.summary()

return model3

我收到此错误:

ValueError: Input 0 of layer sf_vec is incompatible with the layer: : expected min_ndim=2, found ndim=1. Full shape received: [40000]

我知道这是因为维度之间不匹配,但事实是输出层(张量)的形状应该是[?,40000],而我只得到[40000]的张量,有什么建议吗?

编辑 2.0 我没有注意到我的输出已经是 lambda 层,因此在模型编写方式中我没有收到任何错误,但是从这种方式的摘要中我得到了 lambda 形状(1, 40000) 而通常应该是 (None,40000)。 错误在哪里?

最佳答案

如果你想在 2 个张量之间进行乘法,它们需要具有兼容的形状,即相同的形状,或者是 broadcastable 的形状。 。引用numpy文档(tensorflow遵循相同的广播规则):

When operating on two arrays, NumPy compares their shapes element-wise. It starts with the trailing dimensions and works its way forward. Two dimensions are compatible when

  • they are equal, or
  • one of them is 1

在您的情况下,如果您想使用tf.multiply,您需要向向量添加一个维度,以便它具有相同的维度数。您可以使用 tf.expand_dims 或使用 tf.newaxis 高级索引来实现此目的。

一个例子(使用复合体,就像你的问题一样):

>>> a = tf.complex(tf.random.normal((64,128)),tf.random.normal((64,128)))
>>> a.shape
TensorShape([64, 128])
>>> b = tf.complex(tf.ones(64),tf.ones(64))
>>> b.shape
TensorShape([64])

为了能够使用tf.multiply,您需要向b添加一个维度:

>>> b_exp = tf.exand_dims(b, axis=1)
>>> b_exp.shape
TensorShape([64, 1])
>>> tf.multiply(a,b_exp).shape
TensorShape([64, 128])

注意:在 tf.multiply 上执行 tf.reduce_sum 类似于执行 matrix multiplication

就您而言,您可能可以做类似的事情

>>> tf.matmul(b[tf.newaxis,:], a).shape
TensorShape([1, 128])

如果额外的尺寸困扰您,您可以使用tf.squeeze摆脱它。

关于python - "InvalidArgumentError: Incompatible shapes: [64,40000] vs. [64] [Op:Mul]"在张量之间进行运算时?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65716989/

相关文章:

machine-learning - 在测试 MNIST 时,caffe 测试错误没有名为 "net"的字段

python - 在 2 个不同的列中做滚动平均并在 Python 中创建一个列

python - OptKeras (Keras Optuna Wrapper) - 在我自己的类中使用 optkeras,AttributeError : type object 'FrozenTrial' has no attribute '_field_types'

machine-learning - 从 tensorflow 模型检查点提取权重值

python - YOLO : Either overfits or underfits, 增加batch还是增加样本图像池?

python - 无法弄清楚如何为我自己的数据集在 Keras 的 Conv2D 层中定义 input_shape

neural-network - 基于深度学习的人脸识别(连体架构)

python - 正则表达式:替换文本,除非它位于引号之间

python - 打印不符合数据间隔设置

python - 这些代码示例中列出了哪些函数?