java - Java中命名实体识别的最大熵马尔可夫模型

标签 java nlp

我有一个解析问题,MEMM 可以很好地解决。但我花了很多时间试图找到该算法的良好实现(最好是在 java 中)。以前有人这样做过吗?或者,如果有人有一些可读的文档,我可以自己实现它。

谢谢!

(我已经尝试过 Mallet 并且 jar 里的训练器未实现)

最佳答案

您是否研究过斯坦福 NLP 小组的 CMMClassifier ,发现于Stanford CoreNLP suite of NLP tools

恐怕我无法谈论底层的质量MEMM实现,但它是用 Java 编写的,而且我使用了斯坦福 NLP 的其他几个部分,并取得了相对成功的结果。

我发现有时 CoreNLP 的缺点是其广泛的对象模型以及大多数模块具有的大量依赖项。当人们希望专注于单个工具/类时,与这些依赖项相关的分心和学习曲线可能会很烦人。另一方面,该对象模型有效地对应于许多 NLP 任务所常见的实际低级和中级流程,因此非常有用。

关于java - Java中命名实体识别的最大熵马尔可夫模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13574767/

相关文章:

java - 是否有用于 collections.addAll 的 java 8 语法来处理空参数?

java - 分组,按类型求和,然后使用 Java 流获取差异

java - 斯坦福解析器 - java.io.IOException : Unable to resolve as either class path, 文件名或 URL

python - 使用 Watson SDK API 的主题建模示例

java - OSGi 性能调试

java - 在 Web 应用程序中部署模块

java - Knuth–Morris–Pratt 算法

python - gensim 的 word2vec 中的图层大小

java - 类型化意大利语依赖解析器

python - 在 scikit-learn 中使用具有多项式内核的支持向量分类器