python - 如何通过 Doc2Vec 找到文档中最关键的句子或单词?

标签 python nlp gensim word2vec doc2vec

我已经训练了一个 Doc2Vec 模型来完成一个简单的二元分类任务,但我也很想看看哪些单词或句子在对给定文本的含义的贡献方面更重要。到目前为止,我还没有找到任何相关或有帮助的东西。有什么想法可以实现这个功能吗?我应该从 Doc2Vec 切换到更传统的方法,如 tf-idf 吗?

最佳答案

您问的是模型的可解释性。我看到的一些探索方式:

  • 根据您的分类器,模型的参数可能会告诉您它在看什么。例如,在基于注意力的模型中,模型关注的是讲述。

  • Lime 这样的工具和 Anchor对任何黑盒模型都有用,在这种情况下可能会起作用。两者的文档都展示了如何将其用于文本数据。

关于python - 如何通过 Doc2Vec 找到文档中最关键的句子或单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51798248/

相关文章:

r - R 中用于文本分析的常见名字列表?

python - Doc2vec 超越初学者指导

python - 给定单词的向量(不是单词本身),获取最相似的单词

python - 如何在 Django 中序列化模型?

python - 从文件中的列表自动完成命令行参数

python - 编辑两个 Pandas 列之间的距离

python - spaCy,准备训练数据 : doc. char_span 返回 'None'

model - 在spacy中,如何使用自己在gensim中创建的word2vec模型?

python - PyBrain 网络中所有节点的激活值

python - 从多维数组中选择一些维度