python - 带有样本权重的 keras 自定义指标

我正在尝试在 Keras 中定义一个考虑样本权重的自定义指标。在拟合模型时，我使用样本权重如下:

training_history = model.fit(
        train_data,
        train_labels,
        sample_weight = train_weights,
        epochs = num_epochs,
        batch_size = 128,
        validation_data = (validation_data, validatation_labels, validation_weights ),
    )

我使用的自定义指标的一个例子是 AUC(roc 曲线下的面积)，我定义如下:

from keras import backend as K
import tensorflow as tf

def auc(true_labels, predictions, weights = None):
    auc = tf.metrics.auc(true_labels, predictions, weights = weights)[1]
    K.get_session().run(tf.local_variables_initializer())
    return auc

我在编译模型时使用了这个指标:

model.compile(
        optimizer = optimizer,
        loss = 'binary_crossentropy',
        metrics = ['accuracy', auc]
    )

但据我所知，该指标并未考虑样本权重。事实上，我通过比较使用上面定义的自定义指标训练模型时看到的指标值与我自己从模型输出和样本权重中计算得到的指标值来验证这一点，这确实产生了非常不同的结果。我将如何定义上面显示的 auc 指标以考虑样本权重？

最佳答案

您可以用另一个将 sample_weights 作为参数的函数包装您的指标:

def auc(weights):
    def metric(true_labels, predictions):
        auc = tf.metrics.auc(true_labels, predictions, weights=weights)[1]
        K.get_session().run(tf.local_variables_initializer())
        return auc
    return metric

然后定义一个额外的输入占位符来接收样本权重:

sample_weights = Input(shape=(1,))

然后您的模型可以按如下方式编译:

model.compile(
    optimizer = optimizer,
    loss = 'binary_crossentropy',
    metrics = ['accuracy', auc(sample_weights)]
)

注意:未经测试。

关于python - 带有样本权重的 keras 自定义指标，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54830573/

python - 带有样本权重的 keras 自定义指标

上一篇：Python Pandas 将数据移动到新行

下一篇：python - Numba 支持大整数？