python - Keras误解了训练数据的形状

标签 python tensorflow keras

我的训练数据的格式为(?,15)其中?是可变长度。

创建模型时,请指定以下内容:

inp = Input(shape=(None,15))
conv = Conv1D(32,3,padding='same',activation='relu')(inp)
...

我的训练数据的形状为(35730,?,15)。

在python中检查这个我得到:
X.shape

输出:(35730,)
X[0].shape

输出:(513,15)

当我尝试将模型拟合到训练数据上时,出现ValueError:
Error when checking input: expected input_1 to have 3 dimensions, but got array with shape (35730, 1)

我只能通过在单个样本上使用model.train_on_batch()来训练模型。

我该如何解决?似乎keras认为我的输入数据的形状实际上是(35730,?,15)是(35730,1)

这是keras中的错误还是我做错了什么?

如果重要的话,我正在使用tensorflow后端。这是keras 2

最佳答案

(根据OP对这个问题的评论进行了编辑,他们在此发布了此链接:https://github.com/fchollet/keras/issues/1920)

您的X不是单个numpy数组,而是一个数组数组。 (否则,其形状将为X.shape=(35730,513,15)
对于fit方法,它必须是单个numpy数组。由于长度是可变的,因此无法拥有包含所有数据的单个numpy数组,因此必须将其划分为较小的数组,每个数组包含的数据长度均相同。
为此,您可能应该按形状创建字典,然后手动循环字典(可能还有其他更好的方法...):

#code in python 3.5
xByShapes = {}
yByShapes = {}
for itemX,itemY in zip(X,Y):
    if itemX.shape in xByShapes:
        xByShapes[itemX.shape].append(itemX)
        yByShapes[itemX.shape].append(itemY)
    else:
        xByShapes[itemX.shape] = [itemX] #initially a list, because we're going to append items
        yByShapes[itemX.shape] = [itemY]
最后,您循环这本词典进行培训:
for shape in xByShapes:
    model.fit(
              np.asarray(xByShapes[shape]), 
              np.asarray(yByShapes[shape]),...
              )

掩蔽
另外,您可以填充数据,以便所有样本都使用零或一些虚拟值来具有相同的长度。
然后,在模型中的任何内容之前,您可以添加Masking图层,该图层将忽略这些填充的段。 (警告:某些类型的图层不支持 mask )

关于python - Keras误解了训练数据的形状,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46144191/

相关文章:

python - Keras - 应使用什么精度指标与稀疏分类交叉熵来编译模型

tensorflow - Keras ModelCheckpoint 是否会在多个拟合 session 中保存最佳模型?

python - sqlalchemy 没有设置时间戳默认值

python - 如何允许用户从 Google Cloud Storage 下载图片

tensorflow - 使用 tf.estimator.Estimator 时步数不匹配

filter - 如何在 tensorflow 上可视化学习到的过滤器

TensorFlow 使用 image_dataset_from_directory 加载图像

python - Keras 的 Expand_dims 函数导致张量丢失元数据

python - 将大型 CSV 文件加载到 Oracle 表的技术选择

java - 通过从 Java/Python 中的照片中删除黑色边框,从图像中裁剪精确的文档纸张