python - 尝试下载 nltk 数据时出现 405 错误

标签 python github nltk http-status-code-405

当我尝试下面的代码时

python -c "import nltk; nltk.download('punkt'); 
nltk.download('averaged_perceptron_tagger'); 
nltk.download('maxent_treebank_pos_tagger'); 
nltk.download('wordnet')"

控制台显示

[nltk_data] Error loading punkt: HTTP Error 405: Not allowed.
[nltk_data] Error loading averaged_perceptron_tagger: HTTP Error 405:
[nltk_data]     Not allowed.
[nltk_data] Error loading maxent_treebank_pos_tagger: HTTP Error 405:
[nltk_data]     Not allowed.
[nltk_data] Error loading wordnet: HTTP Error 405: Not allowed.

最佳答案

这是由于 Github 原始文件链接失效造成的。

同时,权宜之计是手动下载文件:

PATH_TO_NLTK_DATA=/home/username/nltk_data/
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip
unzip gh-pages.zip
mv nltk_data-gh-pages/ $PATH_TO_NLTK_DATA

我们正在努力寻找数据和模型下载的替代方法。

与此同时,@everyone 请帮助检查您的脚本并确保您没有重载数据下载!提前致谢!!

请查看https://github.com/nltk/nltk/issues/1787有关此问题的最新更新。

关于python - 尝试下载 nltk 数据时出现 405 错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45318066/

相关文章:

python - Ipython bash/shell 单元魔法 : can I have persistent variables between cells?

python - 没有身份验证的 Django 管理员

git删除本地文件但将文件保留在repo中

github - 我在哪里上传拉取请求消息中使用的图像?

python - nltk : How to prevent stemming of proper nouns

python - 导入库问题 - "ImportError: No Module named ____"

python - 列表评估为 bool 值但作为列表返回

python - 同一个 id 的多个外键。 Django 。设计模式

github - 在 github 工作流中使用 github 组织 secret

python - NLTK tokenizer 和 Stanford corenlp tokenizer 无法区分句号 (.) 处没有空格的 2 个句子