tensorflow - 微调 Blenderbot

标签 tensorflow nlp pytorch huggingface-transformers blenderbot

我一直在尝试微调 HuggingFace: Blendebot 的对话模型。我已经尝试过拥抱脸官方网站上给出的常规方法,它要求我们使用 trainer.train() 方法来完成。我也尝试过使用 .compile() 方法。我已经尝试在我的数据集上使用 PyTorch 和 TensorFlow 进行微调。这两种方法似乎都失败了,并给我们一个错误,指出没有为 Blenderbot 模型调用编译或训练的方法。 我还在网上到处查看,以检查如何根据我的自定义数据对 Blenderbot 进行微调,但没有任何地方正确提及运行时不会抛出错误。我浏览了 Youtube 教程、博客和 StackOverflow 帖子,但没有人回答这个问题。希望有人会在这里回应并帮助我。我也愿意使用其他 HuggingFace 对话模型进行微调。

谢谢! :)

最佳答案

这是我用来微调 blenderbot 模型的链接。

微调方法:https://huggingface.co/docs/transformers/training

blender 机器人:https://huggingface.co/docs/transformers/model_doc/blenderbot

from transformers import BlenderbotTokenizer, BlenderbotForConditionalGeneration
mname = "facebook/blenderbot-400M-distill"
model = BlenderbotForConditionalGeneration.from_pretrained(mname)
tokenizer = BlenderbotTokenizer.from_pretrained(mname)


#FOR TRAINING: 

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=small_train_dataset,
    eval_dataset=small_eval_dataset,
    compute_metrics=compute_metrics,
)
trainer.train()

#OR

model.compile(
    optimizer=tf.keras.optimizers.Adam(learning_rate=5e-5),
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    metrics=tf.metrics.SparseCategoricalAccuracy(),
)

model.fit(tf_train_dataset, validation_data=tf_validation_dataset, epochs=3)

这些都行不通! :(

关于tensorflow - 微调 Blenderbot,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72774975/

相关文章:

tensorflow - 如何通过 conda 安装 tensorflow 插件

python - 将TensorFlow Faster R-CNN卡住图转换为Intel OpenVINO框架时发生内部错误

algorithm - 比较和匹配来自不同商店/供应商的产品名称

python - Python 中的密封/非密封包

numpy - TypeError : can't convert np. numpy.object_ 类型的 ndarray

python - Keras : 'can not import name ' abs' 导入错误

machine-learning - 更改 TensorFlow Cifar10 示例后精度较低

nlp - 英语动词列表及其时态、各种形式等

nlp - OpenAI GPT-3 API : How does it count tokens for different languages?

deep-learning - 我们是否应该使用 Huggingface(预)训练一个 BERT 无框模型的小写输入数据?