python - nltk pos 标签咒语

标签 python tags nltk part-of-speech

有没有办法使用 NLTK 显示给定文本中哪些词是填充词? 如果没有,有谁知道我在哪里可以得到一个用英文填词的词表? 谢谢

已解决: from nltk.corpus import stopwords

最佳答案

NLTK 本身不提供这样的列表,但可以在 Web 上的其他地方找到许多列表。

存在相当多的来源:Web 搜索带有“profanity“badwords.txt”blacklists.txt 的词表将产生许多来源。

在我们公司的案例中,我们最终创建了自己的列表并根据需要添加到其中。根据您的受众,必须调整和调整列表。

最后,尽管这 SO question已关闭(关于 php)我发现引用资料和讨论非常有用。

更新:您需要的是停用词列表。

  1. 尝试:http://www.ranks.nl/resources/stopwords.html
  2. MIT also maintains a list停用词。

希望对您有所帮助。

关于python - nltk pos 标签咒语,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13776933/

相关文章:

python - Django:在 blocktrans 中使用 if-else block 的 firstof

javascript - 如何使用 JS 获取完整的 HTML 标签并放入文本区域

javascript - 如何在 AngularJS ngInputTags 中调用标签删除函数

用于大型数据集分类的 NLP 软件

python - 将文本拆分成段落 NLTK - nltk.tokenize.texttiling 的用法?

python - 正在运行的 python 应用程序的内存分析

python - 将python输出保存为pdf?

Python:获取列表的索引

git - 如何使用 JGit 创建和推送标签

python - Nltk 中的 WordNetLemmatizer 可以词干吗?