下面的代码是获取每个句子的文档的示例代码。
为了获取每个单词的属性,我们使用文档,示例代码如下。
通过深入挖掘这些稀疏代码,我可以发现,对于每个名词,我们确实都有与之相关的形态学。
从这个spacy的源代码中查看ID(字典)的值:click here
我的问题:
我无法获取每个名词标记的形态值。我怎样才能得到相同的..?
最佳答案
我不确定您选择的单词,但听起来您是在问如何获取每个标记的形态属性。 token 的形态属性可以像这样查找:
>>> nlp = spacy.load('en')
>>> doc = nlp('Dogs are friendly.')
>>> token = doc[0] # Dogs
>>> nlp.vocab.morphology.tag_map[token.tag_]
{74: 91, 'Number': 'plur'}
>>>
关于python - 获取由 spacy 解析器创建的每个 token 的 Spacy.Vocab.Morphology id,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39330236/