c - 用于简单 POS 标记的 NLP 库

标签 c nlp artificial-intelligence tagging

我是一名从事 NLP 暑期项目的学生。我是这个领域的新手,所以如果有一个非常明显的解决方案,我深表歉意。该项目是用 C 语言编写的,这既是因为我对它很熟悉,也是因为该项目的计算密集型性质(我的语料库是维基百科的纯文本转储)。

我正在研究一种关系提取方法,利用一致性原则尝试学习(在某个错误阈值范围内)一组规则,这些规则规定哪些语法对象簇暗示这些对象之间的联系。

该算法的第一步涉及找到给定单词可以指代的所有可能语法对象的集合(POS 消歧由算法在后面的步骤中隐式完成)。我看过几个解析器,但它们似乎都自己执行消歧步骤,这(从我的角度来看)适得其反。我正在寻找现成的东西,它(理想情况下)可以给我一种单命令方式来显示这些信息。

有这样的东西吗?如果没有,是否存在包含此信息的现有字典,这些信息可以简单地由机器解析?

感谢您的帮助。

最佳答案

看看 CMU Sphinx。一个开源的 NLP 项目。我认为它在 C++ 中,但您可以集成它或至少了解如何处理事情。

关于c - 用于简单 POS 标记的 NLP 库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10926398/

相关文章:

Java 最短成本路径 : Uninformed/Informed search from a (. txt) 文本文件

c预处理器将多个参数作为一个参数传递

python - 对新文档进行分类 - 随机森林、词袋

nlp - 安装YamCha包时出错

parsing - 有谁知道一个好的快速但肮脏的文本/语法解析器?

c# - 人工智能测试框架

python - 为什么在使用 Deep Q 学习时会弹出此错误?

C 程序没有打印正确的总和

c - 程序计算可被给定数字整除的数字

c - 如果 GCC 错误 _Pragma 出现在中间预处理步骤中,它会触发吗?