我一直在使用spaCy用于解析和标记文本并使用生成的依赖树和其他属性来获取含义的 Python 包。现在我想使用 SyntaxNet 的 Parsey McParseface 进行解析和依赖标记(这看起来更好),但我想继续使用 spaCy API,因为它非常易于使用,而且它可以做很多 Parsey 做不到的事情。 SyntaxNet 以 CoNLL 格式输出 POS 标签和依赖标签/树:
- Bob _ 名词 NNP _ 2 nsubj _ _
- 带来了 _ VERB VBD _ 0 ROOT _ _
- _ DET DT _ 4 det _ _
- 披萨 _ NOUN NN _ 2 dobj _ _
- 到 _ ADP IN _ 2 准备 _ _
- Alice _ 名词 NNP _ 5 pobj _ _
- >。 _。 . _ 2 点 _ _
spaCy 似乎能够正确读取 CoNLL 格式 here .但我无法弄清楚在 spaCy 的 API 中,它在哪里接受了 CoNLL 格式的字符串。
最佳答案
来自 the spaCy blog :
Obviously, we want to build a bridge between Parsey McParseface and spaCy, so that you can use the more accurate model with the sweeter spaCy API.
但是,看起来在这成为可能之前还有很多工作要做。
另请参阅 spaCy 作者的回复 here .
关于python - 如何将 SyntaxNet 解析器/标记器与 spaCy API 一起使用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37933803/