python - 用于多输入图像的 VGG16 网络

标签 python tensorflow machine-learning keras deep-learning

我正在尝试将 VGG16 网络用于多个输入图像。 使用具有 2 个输入的简单 CNN 训练该模型给了我一个 acc。大约 50%,这就是为什么我想使用 VGG16 这样的既定模型来尝试。
这是我尝试过的:

# imports
from keras.applications.vgg16 import VGG16
from keras.models import Model
from keras.layers import Conv2D, MaxPooling2D, Activation, Dropout, Flatten, Dense

def def_model():
    model = VGG16(include_top=False, input_shape=(224, 224, 3))
    # mark loaded layers as not trainable
    for layer in model.layers:
        layer.trainable = False
    # return last pooling layer
    pool_layer = model.layers[-1].output
    return pool_layer

m1 = def_model()
m2 = def_model() 
m3 = def_model()

# add classifier layers
merge = concatenate([m1, m2, m3])

# optinal_conv = Conv2D(64, (3, 3), activation='relu', padding='same')(merge)
# optinal_pool = MaxPooling2D(pool_size=(2, 2))(optinal_conv)
# flatten = Flatten()(optinal_pool)

flatten = Flatten()(merge)
dense1 = Dense(512, activation='relu')(flatten)
dense2 = Dropout(0.5)(dense1)
output = Dense(1, activation='sigmoid')(dense2)


inshape1 = Input(shape=(224, 224, 3))
inshape2 = Input(shape=(224, 224, 3))
inshape3 = Input(shape=(224, 224, 3))
model = Model(inputs=[inshape1, inshape2, inshape3], outputs=output)

  1. 我在调用 Model 函数时收到此错误。
ValueError: Graph disconnected: cannot obtain value for tensor Tensor("input_21:0", shape=(?, 224, 224, 3), dtype=float32) at layer "input_21". The following previous layers were accessed without issue: []`

我知道该图是断开的,但我找不到位置。
以下是 compilefit 函数。

# compile model
model.compile(optimizer="Adam", loss='binary_crossentropy', metrics=['accuracy'])
model.fit([train1, train2, train3], train, 
           validation_data=([test1, test2, test3], ytest))
  • 我对一些行进行了评论:optinal_convoptinal_pool。在 concatenate 函数之后应用 Conv2DMaxPooling2D 会产生什么效果?
  • 最佳答案

    我建议查看这个答案 Multi-input Multi-output Model with Keras Functional API 。这是实现这一目标的一种方法:

    # 3 inputs 
    input0 = tf.keras.Input(shape=(224, 224, 3), name="img0")
    input1 = tf.keras.Input(shape=(224, 224, 3), name="img1")
    input2 = tf.keras.Input(shape=(224, 224, 3), name="img2")
    concate_input = tf.keras.layers.Concatenate()([input0, input1, input2])
    # get 3 feature maps with same size (224, 224)
    # pretrained models needs that
    input = tf.keras.layers.Conv2D(3, (3, 3), 
                         padding='same', activation="relu")(concate_input)
    
    # pass that to imagenet model 
    vg = tf.keras.applications.VGG16(weights=None,
                                     include_top = False, 
                                     input_tensor = input)
    
    # do whatever 
    gap = tf.keras.layers.GlobalAveragePooling2D()(vg.output)
    den = tf.keras.layers.Dense(1, activation='sigmoid')(gap)
    
    # build the complete model 
    model = tf.keras.Model(inputs=[input0, input1, input2], outputs=den)
    

    enter image description here

    关于python - 用于多输入图像的 VGG16 网络,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66973552/

    相关文章:

    python - 如何更改 tkinter 'show' 方法中的 'entry' 值

    machine-learning - 测试结果不一致意味着什么?

    python - python 中数组排序不正确

    python - 在访问 MySQL 时使用不同的用户进行选择/插入

    python - 如何像这样创建一个 : 的二维张量

    python - 额外的优化器会影响正则化损失

    python - 无论输入如何,Keras 上的 CNN 都会收敛到相同的值

    python - 有没有一种方法可以使用一步预测器模型来预测 future 的多步?

    machine-learning - 机器学习从图片中估计照明方向?

    python - 使用 Python 读取 UTF8 CSV 文件