python - 未找到朋克

标签 python anaconda nltk

我刚刚开始自然语言处理,我想知道如何正确运行 word_tokenizesent_tokenize。我知道 python 已经建议执行以下操作

import nltk
nltk.download('punkt')

但是我们的代理阻止我们使用 python“下载”。 幸运的是,我可以通过http://www.nltk.org/nltk_data/下载文件。

我尝试创建 nltk_data 并在那里提取 punkt,但问题仍然存在。我想知道如何利用您的专业知识来解决这个问题。

abcd

最佳答案

已修复!

您不应将 punkt 放在 nltk_data 下,而应在 nltk_data 内创建一个标有“tokenizers”的新文件夹punkt 应该放在里面

示例:

C:\Users\(username)\nltk_data\tokenizers\punkt

关于python - 未找到朋克,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53604895/

相关文章:

python - sklearn LogisticRegression - 绘图显示系数太小

python - 在 python 中使用 subprocess 调用一整串参数

python - 如何使用 conda 安装 pydotplus

python - 斯坦福解析器和 nltk 产生(正则表达式匹配?)错误

python - 使用 PerceptronTagger 阅读我自己的 NLTK 词性标记数据集

python - 使用 Krippendorff Alpha 的 NLTK 注释者间协议(protocol)

python - 在 python 中使用数据框实现函数

python - 将 OpenCV 获取的图像保存到另一台计算机上(使用 FTP 或其他方式)

docker - 如何重新运行continuationmio/anaconda3 Docker镜像?

python - 在 Amazon Elastic Beanstalk 上安装 Anaconda