我有一个解析问题,MEMM 可以很好地解决。但我花了很多时间试图找到该算法的良好实现(最好是在 java 中)。以前有人这样做过吗?或者,如果有人有一些可读的文档,我可以自己实现它。
谢谢!
(我已经尝试过 Mallet 并且 jar 里的训练器未实现)
最佳答案
您是否研究过斯坦福 NLP 小组的 CMMClassifier ,发现于Stanford CoreNLP suite of NLP tools ?
恐怕我无法谈论底层的质量MEMM实现,但它是用 Java 编写的,而且我使用了斯坦福 NLP 的其他几个部分,并取得了相对成功的结果。
我发现有时 CoreNLP 的缺点是其广泛的对象模型以及大多数模块具有的大量依赖项。当人们希望专注于单个工具/类时,与这些依赖项相关的分心和学习曲线可能会很烦人。另一方面,该对象模型有效地对应于许多 NLP 任务所常见的实际低级和中级流程,因此非常有用。
关于java - Java中命名实体识别的最大熵马尔可夫模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13574767/