nlp - 韩语、泰语和印尼语 POS 标记器

标签 nlp nltk cjk pos-tagger thai

有人可以为韩语、印尼语、泰语和越南语推荐一个开源的 POS 标记器吗?

我可以用它来标记我目前拥有的语料库数据。 (例如 the stanford-postagger )

如果您是开发人员并且愿意分享并让我测试 POS 标记器,我也不介意。

通过对输出进行一些修改,我用 jvntextpro 对越南数据进行了 POS 标记。

但我仍然希望更多地了解韩语、印尼语和泰语 POS 标记。

最佳答案

在 acl wiki 之后:Korean morphological analyzer and part-of-speech tagger

我会开始查看韩国、泰国和韩国 NLP 研究部门的网站。 On this page ,您将找到研究部门的链接。

祝你好运!

更新:OpenNLP有泰国PoS。型号如下:http://opennlp.sourceforge.net/models/thai/用于 PoS opennlp 标记器。

关于nlp - 韩语、泰语和印尼语 POS 标记器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5280572/

相关文章:

python - 为什么我的 NLTK 函数在处理 DataFrame 时很慢?

带有日语注音假名的 MySQL 正则表达式

java - UTF-8 CJK 字符未在 Java 中显示

支持多种语言(尽可能多)的 Javascript word tokenizer 库

nlp - 无趣单词列表

python - 在 python 中精确复制 R 文本预处理

python - 如何正确取消引用应该包含日语符号的网址

python - 如何在Python中找到重复的字符串段?

python-3.x - 将具有相同含义的单词分类

python - 使用正则表达式查找段落中出现特定短语后的所有名词短语