java - 文本处理以识别词性

标签 java text full-text-search nlp

我必须编写一个程序(用Java)来识别几个词性,如名词、形容词、动词等。该程序还应该识别数字(数字,例如10)和用简单英语书写的数字(十、百)等)等等。我不确定前进的方向是什么。有没有可用的图书馆可以提供帮助?这只能用正则表达式来完成吗?还是我需要学习NLP?

请提出前进的方向。

最佳答案

(1) OpenNLP

(2) 灵管

(3)斯坦福自然语言处理

以上所有 3 个(基于 Java)将帮助您开箱即用地识别 POS。

对于数字,请使用正则表达式。

关于java - 文本处理以识别词性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15742892/

相关文章:

文本比较算法

string - 使用 Perl 从字符串中删除 BOM

search - Elasticsearch 中的索引和搜索分析器:将准确的字符串作为第一个结果时遇到麻烦

java - Swagger 集成多个 jaxrs 服务器

java - JSoup 解析 HTML

qt - 截断文本字段中的 "real"值?

php - ElasticSearch Laravel侦察异常(exception)

java - GWT - 如何异步发送表单?

Java 文件树错误(FileTreeModel 无法解析为类型)

search - Solr:当索引短语短于查询时进行短语搜索