nlp - 如何向 MeCab 添加停用词?

标签 nlp stop-words mecab

我想向 MeCab 添加停用词,例如“我”、“你”等。 但我在MeCab的手册上找不到任何停用词的信息。

最佳答案

MeCab 是一个词性标注器,它不删除停用词。

您需要通过处理输出并查看表面形式(文字标记)、基本形式(词形还原规范形式)或词性来自行删除停用词。

关于nlp - 如何向 MeCab 添加停用词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13065960/

相关文章:

nlp - Lojban 能否比英语在自然语言理解方面表现得更好?

c# - 如何获取我的全文目录中使用的停用词列表?

ruby - 使用 Natto gem (Mecab) 将日文汉字转换为注音假名

python - 在pytorch中计算困惑度

android - 如何让 api.ai 代理动态学习一些东西?

python - 使用 Keras 进行文本分类

python - 如何在Python中获取列表值和计数

python - 为什么使用Python的wordcloud库时没有将停用词排除在词云之外?

mecab - 为什么行ける会解析成单个token,而见ららる会解析成2(见+られる)?

nlp - MeCab 输出和标签集是什么?