java - java opennlp工具包中内置Porter Stemmer

标签 java machine-learning nlp opennlp porter-stemmer

就像python nltk(https://stackoverflow.com/a/10369407/3096792)中内置了Porter Stemmer一样,我想知道java apache opennlp中是否有内置的Porter Stemmer,尽管这个包下有一个接口(interface)[opennlp.tools .stemmer.Stemmer]。由于我现在不知道或不需要知道词干背后的算法,所以我需要 apache opennlp 工具包下的标准包。如果不存在,java中的替代方案是什么?

最佳答案

您可以使用 Apache Lucene Snowball 库 here

只需将此 jar 文件放入您的构建路径中并使用它

PorterStemmer stemmer = new PorterStemmer();
stemmer.setCurrent(input); //set string you need to stem
stemmer.stem();  //stem the word
stemmer.getCurrent();//get the stemmed word

关于java - java opennlp工具包中内置Porter Stemmer,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28083377/

相关文章:

python - 查找句子字符串中单词的不同实现 - Python

java - 489次成功连接后android蓝牙连接失败

android - 如何将经过训练的 scikit-learn 模型导入到 android 项目中

python - 使用 sklearn 获取实时数据

python - 如何检查 AlchemyAPI 中剩余的调用次数? Python

python - 更高效地实现Textacy/spacy 'subject_verb_object_triples'

java - 本地开发无法禁用 Spring 配置服务器

java - SunX509 的用途是什么?它可以与使用 IbmX509 的各方合作吗?

java - 在 C 中嵌入 Java 库

python - 连续的 DDPG 似乎没有收敛于一个二维空间搜索问题 ("Hunt the Thimble")