nlp - 改进现有的基本手套模型

标签 nlp text-classification glove

我正在使用 GloVe 作为我研究的一部分。我已经从 here 下载了模型.我一直在使用 GloVe 进行句子分类。我正在分类的句子特定于特定领域,比如一些 STEM 主题。但是,由于现有的 GloVe 模型是在通用语料库上训练的,因此对于我的特定任务,它们可能不会产生最佳结果。

所以我的问题是,我将如何加载重新训练的模型并在我自己的语料库上对其进行更多的重新训练,以学习我的语料库的语义?如果可能的话,这样做是有好处的。

最佳答案

经过一番挖掘,我找到了this issue在 git 仓库上。有人提出以下建议:

Yeah, this is not going to work well due to the optimization setup. But what you can do is train GloVe vectors on your own corpus and then concatenate those with the pretrained GloVe vectors for use in your end application.



所以这就是答案。

关于nlp - 改进现有的基本手套模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43618145/

相关文章:

python - 如何使文本分类给出 None 类别

nlp - 如何识别光学字符识别 (OCR) 输出的文本中的实体?

neural-network - 预训练的 GloVe 矢量文件(例如 glove.6B.50d.txt)中的 "unk"是什么?

理解意义的算法

python - Spacy "is a"挖矿

machine-learning - 哪一类是阳性以及在为 ML 准备数据时如何确定真正的警报

nlp - GloVe 词向量余弦相似度 - "Ally"比 "powerful"更接近 'friend"

Python:列表对象没有属性 'lower' - 但语料库已经是小写

prolog - 在我的情况下,哪个序言实现会有所帮助