python - 在 keras 中使用额外输入加载自定义损失

我有一个自定义损失函数，它将模型的输入作为参数之一。如果我在我训练的同一个 session 中加载，我可以使用 this 加载它没有问题。技术。


def custom_loss(inputs):
    def loss(y_true, y_pred):
        return ...
    return loss

inputs = keras.layers.Input(shape=(...))
y = keras.layers.Activation('tanh')(inputs)

model = keras.models.Model(inputs=inputs, outputs=y)

model.compile(loss=custom_loss(inputs), optimizer='Adam')
model.fit(...)
model.save('mymodel.h5')
load_model('mymodel.h5', custom_objects={'custom_loss': custom_loss(inputs})

但是，当我尝试在稍后的 session 中加载模型时遇到问题，因为这次我无法访问原始输入张量。如果我创建一个新的输入占位符，那么模型需要两组不同的输入，我就会出错。

inputs = keras.layers.Input(shape=(...))
load_model('mymodel.h5', custom_objects={'custom_loss': custom_loss(inputs)})

有什么好的方法可以解决这个问题吗？最终的问题是输入尚未反序列化，因此无法将它们传递给自定义对象。

我不想只保存权重并创建具有相同权重的新模型，因为我失去了优化器状态。

最佳答案

另一种方法是计算 Keras 层内的损失，并传递一个虚拟损失函数，该函数仅返回模型的输出作为编译方法中的损失。还有其他方法可以做到这一点。但这是我更喜欢的。

import tensorflow as tf
print('Tensorflow', tf.__version__)

def custom_loss(tensor):
    y_true, y_pred, inputs = tensor[0], tensor[1], tensor[1]
    loss = ...
    return tf.constant([0], dtype=tf.float32)

def dummy_loss(y_true, y_pred):
    return y_pred

def get_model(training=False):
    inputs = tf.keras.layers.Input(shape=(10,))
    y = tf.keras.layers.Activation('tanh')(inputs)
    if training:
        targets = tf.keras.layers.Input(shape=(10,)) 
        loss_layer = tf.keras.layers.Lambda(custom_loss)([targets, y, inputs])
        model = tf.keras.models.Model(inputs=[inputs, targets], outputs=loss_layer)
    else:
        model = tf.keras.models.Model(inputs=inputs, outputs=y)
    return model


model = get_model(training=True)
model.compile(optimizer='sgd', loss=dummy_loss)
model.save('model.h5')

new_model = tf.keras.models.load_model('model.h5', custom_objects={'dummy_loss':dummy_loss})

关于python - 在 keras 中使用额外输入加载自定义损失，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57897080/

python - 在 keras 中使用额外输入加载自定义损失

上一篇：.net - 使用 Azure 网站时出现定期 ServiceBus 错误 "The X.509 certificate CN=servicebus.windows.net is not in the trusted people store"

下一篇：validation - 电子邮件地址中显示名称的最大长度是多少