python - Keras 中带有权重的自定义损失函数

标签 python tensorflow keras neural-network loss-function

我是神经网络的新手。我想在 TensorFlow 中做一个自定义的损失函数,但是我需要得到一个权重向量,所以我是这样做的:

def my_loss(weights):
  def custom_loss(y, y_pred):
    return weights*(y - y_pred)
  return custom_loss
model.compile(optimizer='adam', loss=my_loss(weights), metrics=['accuracy'])
model.fit(x_train, y_train, batch_size=None,  validation_data=(x_test, y_test), epochs=100)


当我启动它时,我收到此错误:
InvalidArgumentError:  Incompatible shapes: [50000,10] vs. [32,10]

形状是:
print(weights.shape)
print(y_train.shape)
(50000, 10)
(50000, 10)

所以我认为这是批次的问题,我对 TensorFlow 没有很强的背景,所以我尝试使用全局变量以一种幼稚的方式解决
batch_index = 0

然后在自定义回调中将其更新到“on_batch_begin” Hook 中。但它不起作用,这是一个可怕的解决方案。那么,如何获得具有相应 y 的权重的确切部分?我有办法在自定义损失中获取当前批次索引吗?
预先感谢您的帮助

最佳答案

Keras 允许您从全局范围内获取任何张量。其实,y_truey_pred甚至可能不被使用,as here .

您的模型可以有多个输入(您可以在推理时将此输入设为虚拟,或使用单个输入将权重加载到模型中)。请注意,您仍然需要它进行验证。

import keras
from keras.layers import *
from keras import backend as K

import numpy as np

inputs_x = Input(shape=(10,))
inputs_w = Input(shape=(10,))

y = Dense(10,kernel_initializer='glorot_uniform' )(inputs_x)

model = keras.Model(inputs=[inputs_x, inputs_w], outputs=[y])

def my_loss(y_true, y_pred):
    return K.abs((y_true-y_pred)*inputs_w)

def my_metrics(y_true, y_pred):
    # just to output something
    return K.mean(inputs_w)



model.compile(optimizer='adam', loss=[my_loss], metrics=[my_metrics])

data = np.random.normal(size=(50000, 10))
labels = np.random.normal(size=(50000, 10))
weights = np.random.normal(size=(50000, 10))


model.fit([data, weights], labels, batch_size=256, validation_data=([data[:100], weights[:100]], labels[:100]), epochs=100)

要在没有权重的情况下进行验证,您需要编译另一个不使用权重的具有不同损失的模型版本。

UPD:另请注意,如果 Keras 返回数组而不是标量,Keras 将总结您损失的所有元素

UPD:Tor tensorflow 2.1.0 似乎变得更加复杂了。要走的路是@marco-cerliani 指出的方向(标签、权重和数据被提供给模型,自定义损失张量是通过 .add_loss() 添加的),但是他的解决方案对我来说开箱即用.第一件事是模型不想使用 None 损失,拒绝同时接受输入和输出。所以,我引入了额外的虚拟损失函数。当数据集大小不能被批量大小整除时,就会出现第二个问题。在 keras 和 tf 1.x 中,最后一批问题通常由 steps_per_epoch 解决和 validation_steps参数,但在这里 if 在第一批 Epoch 2 上开始失败。所以我需要制作简单的自定义数据生成器。
import tensorflow.keras as keras
from tensorflow.keras.layers import *
from tensorflow.keras import backend as K

import numpy as np

inputs_x = Input(shape=(10,))
inputs_w = Input(shape=(10,))
inputs_l = Input(shape=(10,))


y = Dense(10,kernel_initializer='glorot_uniform' )(inputs_x)

model = keras.Model(inputs=[inputs_x, inputs_w, inputs_l], outputs=[y])

def my_loss(y_true, y_pred):
    return K.abs((y_true-y_pred)*inputs_w)

def my_metrics():
    # just to output something
    return K.mean(inputs_w)

def dummy_loss(y_true, y_pred):
    return 0.


loss = my_loss(y, inputs_l)
metric = my_metrics()

model.add_loss(loss)
model.add_metric(metric, name='my_metric', aggregation='mean')


model.compile(optimizer='adam', loss=dummy_loss)

data = np.random.normal(size=(50000, 10))
labels = np.random.normal(size=(50000, 10))
weights = np.random.normal(size=(50000, 10))

dummy = np.zeros(shape=(50000, 10)) # or in can be labels, no matter now


# looks like it does not like when len(data) % batch_size != 0
# If I set steps_per_epoch, it fails on the second epoch.

# So, I proceded with data generator

class DataGenerator(keras.utils.Sequence):
    'Generates data for Keras'
    def __init__(self, x, w, y, y2, batch_size, shuffle=True):
        'Initialization'
        self.x = x
        self.w = w
        self.y = y
        self.y2 = y2
        self.indices = list(range(len(self.x)))
        self.shuffle = shuffle
        self.batch_size = batch_size
        self.on_epoch_end()

    def __len__(self):
        'Denotes the number of batches per epoch'
        return len(self.indices) // self.batch_size

    def __getitem__(self, index):
        'Generate one batch of data'
        # Generate indexes of the batch

        ids = self.indices[index*self.batch_size:(index+1)*self.batch_size]

        # the last None to remove weird warning
        # https://stackoverflow.com/questions/59317919
        return [self.x[ids], self.w[ids], self.y[ids]], self.y2[ids], [None]

    def on_epoch_end(self):
        'Updates indexes after each epoch'
        if self.shuffle == True:
            np.random.shuffle(self.indices)

batch_size = 256

train_generator = DataGenerator(data,weights,labels, dummy, batch_size=batch_size, shuffle=True)

val_generator = DataGenerator(data[:2*batch_size],weights[:2*batch_size],labels[:2*batch_size], dummy[:2*batch_size], batch_size=batch_size, shuffle=True)

model.fit(x=train_generator, validation_data=val_generator,epochs=100)

关于python - Keras 中带有权重的自定义损失函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62393032/

相关文章:

java - 脚本在终端中有效,但在使用 ProcessBuilder 运行时无效

python - 如何存储/保存和恢复tensorflow DNNClassifier(没有要保存的变量)

numpy - 在 Tensorflow 中进行基于切片的乘法的最有效方法

tensorflow - list_local_device tensorflow 未检测到 gpu

python - 无效参数错误 : computed output size would be negative

python - 从文本问题中删除标点符号/数字

python - 用于大型/复杂分析的 iPython Notebook。好主意与否?

python - pandas - 如何添加带索引的行并比较数据的差异?

python - 当我尝试转换 Keras MLP 时,为什么 Google Colab 会给出 "unknown device"错误?

python - 我的二元分类模型的准确性似乎卡住了 : Where did i go wrong?