tensorflow - 微调 Blenderbot

标签 tensorflow nlp pytorch huggingface-transformers blenderbot

我一直在尝试微调 HuggingFace: Blendebot 的对话模型。我已经尝试过拥抱脸官方网站上给出的常规方法，它要求我们使用 trainer.train() 方法来完成。我也尝试过使用 .compile() 方法。我已经尝试在我的数据集上使用 PyTorch 和 TensorFlow 进行微调。这两种方法似乎都失败了，并给我们一个错误，指出没有为 Blenderbot 模型调用编译或训练的方法。我还在网上到处查看，以检查如何根据我的自定义数据对 Blenderbot 进行微调，但没有任何地方正确提及运行时不会抛出错误。我浏览了 Youtube 教程、博客和 StackOverflow 帖子，但没有人回答这个问题。希望有人会在这里回应并帮助我。我也愿意使用其他 HuggingFace 对话模型进行微调。

谢谢! :)

最佳答案

这是我用来微调 blenderbot 模型的链接。

微调方法:https://huggingface.co/docs/transformers/training

blender 机器人:https://huggingface.co/docs/transformers/model_doc/blenderbot

from transformers import BlenderbotTokenizer, BlenderbotForConditionalGeneration
mname = "facebook/blenderbot-400M-distill"
model = BlenderbotForConditionalGeneration.from_pretrained(mname)
tokenizer = BlenderbotTokenizer.from_pretrained(mname)


#FOR TRAINING: 

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=small_train_dataset,
    eval_dataset=small_eval_dataset,
    compute_metrics=compute_metrics,
)
trainer.train()

#OR

model.compile(
    optimizer=tf.keras.optimizers.Adam(learning_rate=5e-5),
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    metrics=tf.metrics.SparseCategoricalAccuracy(),
)

model.fit(tf_train_dataset, validation_data=tf_validation_dataset, epochs=3)

这些都行不通! :(

关于tensorflow - 微调 Blenderbot，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/72774975/

上一篇：Haskell:如何使用正确的退出代码向用户报告命令行参数的验证错误

下一篇：Rust:f32 上奇怪的基于状态的舍入行为

python - 将TensorFlow Faster R-CNN卡住图转换为Intel OpenVINO框架时发生内部错误

algorithm - 比较和匹配来自不同商店/供应商的产品名称

python - Python 中的密封/非密封包

numpy - TypeError : can't convert np. numpy.object_ 类型的 ndarray

python - Keras : 'can not import name ' abs' 导入错误

machine-learning - 更改 TensorFlow Cifar10 示例后精度较低

nlp - 英语动词列表及其时态、各种形式等

nlp - OpenAI GPT-3 API : How does it count tokens for different languages?

deep-learning - 我们是否应该使用 Huggingface(预)训练一个 BERT 无框模型的小写输入数据？