java - 完全免费的 nlp 解析器?

标签 java nlp opennlp

到目前为止,我已经评估了一些著名的 Java 解析器,但没有一个实际上以某种方式免费用于商业用途。像 OpenNLP 一样,它是免费的,但使用的训练数据不可用于商业目的。 Morphaadorner 就在那里,但它的最后一次更新似乎是在 2009 年。Stanford NLP 是完整的 GPL,而 LingPipe 提供付费许可证。

作为目前一家没有资金的初创公司,我确实不可能支付高额许可费。我必须根据我的要求实现一个基于规则的解析器,这与行业标准解决方案无法比拟。

不过,我不是一个自由狂,我也不需要世界上只有少数人在使用的东西。我坚信,像 NLP 这样的东西正在变得流行,再次实现 POS Tagger 就像重新发明一个轮子一样。难道真的没有行业标准解决方案吗?

更新:这种心态似乎行业标准意味着付费。那么为什么几个 HTML 解析器库(以及其他东西)是免费的呢? Html 解析器比 NLP 更常用,但对 NLP 任务的需求仍然相当大。

更新:问题已结束。我很快就会很高兴地发布我的小型关键字提取库,该库利用 Wordnet 和各种漂亮的规则。 谢谢 AB

最佳答案

您已经确定了解决方案:

Stanford NLP is full GPL ...

没有禁止在商业项目中使用 GPL。

问题是,如果您以二进制形式分发代码,则还必须提供源代码。这意味着您的业务模式需要基于向客户提供付费支持和/或服务(而不是销售软件许可证)......但有许多公司基于类似的模式赚了很多钱。

<小时/>

这是关于此主题的另一个问答,其中包含一些其他潜在的线索:

<小时/>

The mindset seems industry-standard means a paid thing. Then how come several libraries of HTML parsers(among other stuffs) come free. Html parsers ar far more used than NLP, but still, there is fairly large requirement for NLP tasks.

开发此类产品的团队(或组织或公司)可以决定如何对其进行许可。现有的 NLP 产品似乎都不是“像啤酒一样免费”的。这是他们的选择。而且你没有权利提示……因为你也选择不“像啤酒一样免费”提供你的应用程序。

正如我所指出的,斯坦福 NLP 是“像 Libre 一样免费”。只是您不准备承担 GPL 的义务。

没有人有义务免费为你做事。作为一名 future 的企业家,您不应该对此抱有期望。

(FWIW,之所以有免费的 HTML 解析器,以及许多其他事情,通常是因为问题比 NLP 容易几个数量级,或者有一些公司/组织在那里捐赠大量资源来开发代码。)

关于java - 完全免费的 nlp 解析器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16765817/

相关文章:

python - 查询数据维度必须与训练数据维度匹配

android - 如何在语义上比较两个句子?

java - 如何加载 'ParserModel' 以及将 "en-parser-chunking.bin"文件放置在 Web 应用程序中的何处?

java - NetBeans 中的无效部署描述符错误

java - 使用 Java 中的 Bouncy CaSTLe 自签名 X509 证书

java - OpenNLP 的解析器标签

java - 如何在openNLP chunker中识别PP-tags/NP-tags/VP-tags?

java - 在数据库中插入 clob 数据或所有类型的文件存储

java - 如何通过 JNI 将 C 字符串 Emoji 传递到 Java

java - 使用 Apache Solr 的半自然语言搜索