我一直在尝试微调 HuggingFace: Blendebot 的对话模型。我已经尝试过拥抱脸官方网站上给出的常规方法,它要求我们使用 trainer.train() 方法来完成。我也尝试过使用 .compile() 方法。我已经尝试在我的数据集上使用 PyTorch 和 TensorFlow 进行微调。这两种方法似乎都失败了,并给我们一个错误,指出没有为 Blenderbot 模型调用编译或训练的方法。 我还在网上到处查看,以检查如何根据我的自定义数据对 Blenderbot 进行微调,但没有任何地方正确提及运行时不会抛出错误。我浏览了 Youtube 教程、博客和 StackOverflow 帖子,但没有人回答这个问题。希望有人会在这里回应并帮助我。我也愿意使用其他 HuggingFace 对话模型进行微调。
谢谢! :)
最佳答案
这是我用来微调 blenderbot 模型的链接。
微调方法:https://huggingface.co/docs/transformers/training
blender 机器人:https://huggingface.co/docs/transformers/model_doc/blenderbot
from transformers import BlenderbotTokenizer, BlenderbotForConditionalGeneration
mname = "facebook/blenderbot-400M-distill"
model = BlenderbotForConditionalGeneration.from_pretrained(mname)
tokenizer = BlenderbotTokenizer.from_pretrained(mname)
#FOR TRAINING:
trainer = Trainer(
model=model,
args=training_args,
train_dataset=small_train_dataset,
eval_dataset=small_eval_dataset,
compute_metrics=compute_metrics,
)
trainer.train()
#OR
model.compile(
optimizer=tf.keras.optimizers.Adam(learning_rate=5e-5),
loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
metrics=tf.metrics.SparseCategoricalAccuracy(),
)
model.fit(tf_train_dataset, validation_data=tf_validation_dataset, epochs=3)
这些都行不通! :(
关于tensorflow - 微调 Blenderbot,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72774975/