python - 获取由 spacy 解析器创建的每个 token 的 Spacy.Vocab.Morphology id

标签 python nlp cython spacy pos-tagger

下面的代码是获取每个句子的文档的示例代码。

Get docs

为了获取每个单词的属性，我们使用文档，示例代码如下。

Get Tokens

通过深入挖掘这些稀疏代码，我可以发现，对于每个名词，我们确实都有与之相关的形态学。

从这个spacy的源代码中查看ID(字典)的值:click here

我的问题:

我无法获取每个名词标记的形态值。我怎样才能得到相同的..？

最佳答案

我不确定您选择的单词，但听起来您是在问如何获取每个标记的形态属性。 token 的形态属性可以像这样查找:

>>> nlp = spacy.load('en')
>>> doc = nlp('Dogs are friendly.')
>>> token = doc[0]  # Dogs
>>> nlp.vocab.morphology.tag_map[token.tag_]
{74: 91, 'Number': 'plur'}
>>>

关于python - 获取由 spacy 解析器创建的每个 token 的 Spacy.Vocab.Morphology id，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39330236/

上一篇：python - Pandas 时间子集时间序列 - 特定时间以上的日期

下一篇：python - 使用 matplotlib.pyplot 时没有可见的 text()

python - __init__.py 似乎不起作用

使用 pycrypto 使用公钥对 Python 日志进行加密

python - 网络抓取数据的词形还原

python - PyArray_SimpleNewFromData 中的奇怪段错误

python - 如何在 Cython 中使用内联函数

python - 使用 Python 从 C/C++ DLL 调用方法

scikit-learn - 如何从 MultinomialNB 中获取新数据的预测？

text - 围绕主题聚集短语

c++ - 如何用 Cython 包装 C++ 类？