Python keras 神经网络 (Theano) 包返回有关数据维度的错误

标签 python numpy canopy theano keras

我有这个代码:

import numpy as np
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation
from keras.optimizers import SGD
from sklearn import datasets
import theano

iris = datasets.load_iris()
X = iris.data[:,0:3]  # we only take the first two features.
Y = iris.target

X = X.astype(theano.config.floatX)
Y = Y.astype(theano.config.floatX)


model = Sequential()
model.add(Dense(150, 1, init='uniform'))
model.add(Activation('tanh'))
model.add(Dropout(0.5))
model.add(Dense(150, 1, init='uniform'))
model.add(Activation('tanh'))
model.add(Dropout(0.5))
model.add(Dense(150, 1, init='uniform'))
model.add(Activation('softmax'))

sgd = SGD(lr=0.1, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='mean_squared_error', optimizer=sgd)

model.fit(X, Y, nb_epoch=20, batch_size=150)


score = model.evaluate(X_train, y_train, batch_size=16)

返回此错误:

ValueError: Shape mismatch: x has 3 cols (and 150 rows) but y has 150 rows (and 1 cols)
Apply node that caused the error: Dot22(<TensorType(float64, matrix)>, <TensorType(float64, matrix)>)
Inputs types: [TensorType(float64, matrix), TensorType(float64, matrix)]
Inputs shapes: [(150L, 3L), (150L, 1L)]
Inputs strides: [(24L, 8L), (8L, 8L)]
Inputs values: ['not shown', 'not shown']

问题是什么?

最佳答案

您为内部层指定了错误的输出尺寸。请参阅 Keras 文档中的示例:

model = Sequential()
model.add(Dense(20, 64, init='uniform'))
model.add(Activation('tanh'))
model.add(Dropout(0.5))
model.add(Dense(64, 64, init='uniform'))
model.add(Activation('tanh'))
model.add(Dropout(0.5))
model.add(Dense(64, 2, init='uniform'))
model.add(Activation('softmax'))

注意一层的输出大小如何匹配下一层的输入大小:

20x64 -> 64x64 -> 64x2

第一个数字始终是输入大小(上一层的神经元数量),第二个数字始终是输出大小(下一层的神经元数量)。所以在这个例子中你有四层:

  • 具有 20 个神经元的输入层
  • 具有 64 个神经元的隐藏层
  • 具有 64 个神经元的隐藏层
  • 具有 2 个神经元的输出层

您唯一的硬性限制是第一个(输入)层需要具有与您的特征一样多的神经元,而最后一个(输出)层需要具有与您的任务所需一样多的神经元。

对于您的示例,由于您具有三个特征,因此您需要将输入层大小更改为 3,并且您可以保留此示例中的两个输出神经元来进行二元分类(或者使用一个,就像您所做的那样,使用 logistic损失)。

关于Python keras 神经网络 (Theano) 包返回有关数据维度的错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30384908/

相关文章:

python - 在 64 位 Windows 上让 cython 与 Enthought Canopy 配合使用的官方方法是什么?

python - 将标量值分配给另一个数组中的 numpy 数组的所有元素

python - 静态的还是恒定的,或者它们是什么?

python - 使用 h5py 从大文件读取而不将整个文件加载到内存中

python - 有没有更有效的方法来切片多维数组

python - 将numpy数组的组名映射到索引的最快方法是什么?

python - Sublime Text 3 不使用默认的 python

python - 用python读取一个复杂的CSV文件

Python pandas CustomBusinessDay

python - 将图像从黑色像素复制为白色像素