javascript - 使用 Javascript 设计 NLP API

标签 javascript api nlp

我正在处理 nat-js (Javascript 中的 NLP 工具包),我计划将其扩展以处理其他语言,例如英语和西类牙语;今天它只处理葡萄牙语。

使用 nat-js,当您需要标记器时,您可以编写如下内容:

var tkz = new nat.tokenizer();

但是如何才能处理其他语言呢?您对此有何看法:

var nat = new natFactory('pt');
var tkz = new nat.tokenizer();

我一直在思考一件事:如果您只需要葡萄牙语的分词器,为什么还要加载完整的库?我可以提供一种仅加载所需文件的简单方法吗?

最佳答案

我以前没有听说过它,但我看了 nat-js ,似乎因为它主要是为葡萄牙语创建的,所以在如何重组库方面你将有很大的灵 active 。我建议查看一些更大/被接受的 NLP 库,例如 CoreNLP、nltk 和 openNLP。它们以不同的方式处理不同语言的分词器初始化。 就我个人而言,我喜欢你基于语言创建工厂的方法。也许一项改进是这样的:

var ptnat = new portugueseNatFactory();
var tkz = ptnat.tokenizer();

这样,您可以将更多的主库分离成更小的每种语言标记器,而不是在工厂类中进行一些解析和猜测

关于javascript - 使用 Javascript 设计 NLP API,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20019841/

相关文章:

api - 付费 API 以获得网站的传入链接?

python - tensorflow 。值错误: The two structures don't have the same number of elements

javascript - 所有 Bootstrap 下拉菜单都显示相同的项目

javascript - 在框架集之外创建头标签

javascript - jquery .html() 注入(inject)对象与包含对象的变量

api - 不同语言的雅虎天气

javascript - 编写一个更新/保存的 Mongoose 方法?

java - 如何在不使用 PHP 代码的情况下在 android 中使用 woocommerce API

text - 是否可以用作者信息补充朴素贝叶斯文本分类算法?

full-text-search - Lucene标准分析仪vs Snowball