我正在研究一个问题,用于根据奶牛的图像预测奶牛的肥胖程度。
我应用了 CNN 来估计介于 0-5 之间的值(我拥有的数据集仅包含介于 2.25 和 4 之间的值)
我使用了 4 个 CNN 层和 3 个隐藏层。
我实际上有两个问题:
1/我得到了 0.05 的训练误差,但是在 3-5 个 epoch 之后,验证误差仍然保持在 0.33 左右。
2/我的神经网络预测的值在 2.9 到 3.3 之间,与数据集范围相比太窄了。正常吗?
我怎样才能改进我的模型?
model = tf.keras.models.Sequential([
tf.keras.layers.Conv2D(16, (3,3), activation='relu', input_shape=(512, 424,1)),
tf.keras.layers.MaxPooling2D(2, 2),
tf.keras.layers.Conv2D(32, (3,3), activation='relu'),
tf.keras.layers.MaxPooling2D(2, 2),
tf.keras.layers.Conv2D(32, (3,3), activation='relu'),
tf.keras.layers.MaxPooling2D(2, 2),
tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
tf.keras.layers.MaxPooling2D(2,2),
tf.keras.layers.Flatten(input_shape=(512, 424)),
tf.keras.layers.Dense(256, activation=tf.nn.relu),
tf.keras.layers.Dense(128, activation=tf.nn.relu),
tf.keras.layers.Dense(64, activation=tf.nn.relu),
tf.keras.layers.Dense(1, activation='linear')
])
学习曲线:
预言:
最佳答案
这似乎是过度拟合的情况。你可以
Shuffle
Data
,通过使用 shuffle=True
在 cnn_model.fit
.代码如下所示:history = cnn_model.fit(x = X_train_reshaped,
y = y_train,
batch_size = 512,
epochs = epochs, callbacks=[callback],
verbose = 1, validation_data = (X_test_reshaped, y_test),
validation_steps = 10, steps_per_epoch=steps_per_epoch, shuffle = True)
Early Stopping
.代码如下所示callback = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=15)
from tensorflow.keras.regularizers import l2
Regularizer = l2(0.001)
cnn_model.add(Conv2D(64,3, 3, input_shape = (28,28,1), activation='relu', data_format='channels_last',
activity_regularizer=Regularizer, kernel_regularizer=Regularizer))
cnn_model.add(Dense(units = 10, activation = 'sigmoid',
activity_regularizer=Regularizer, kernel_regularizer=Regularizer))
BatchNormalization
. ImageDataGenerator
执行图像数据增强.引用 this link有关更多信息。 Normalized
,将像素值除以 255
也有帮助。 Pre-Trained Models
喜欢 ResNet
或 VGG Net
等。关于python - 如何改进我的CNN?高且恒定的验证错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57061266/