python - 如何从 nltk 下载器中删除数据/模型?

标签 python directory nltk delete-file

我在 python3 NLTK 中安装了一些 NLTK 包(通过 nltk.download()),尝试了它们并且 - 不需要它们 - 现在想删除它们。

我如何从我的 NLTK 安装中删除包 large_grammars? (我不想删除完整的 NLTK 安装!)

最佳答案

默认情况下,NLTK 包/数据保存在 nltk_data 目录中。

首先,您必须找到目录可能所在的位置:

>>> import nltk
>>> nltk.data.path
['/home/alvas/nltk_data', '/usr/share/nltk_data', '/usr/local/share/nltk_data', '/usr/lib/nltk_data', '/usr/local/lib/nltk_data']

检查nltk_data的确切位置:

>>> import os
>>> next(p for p in nltk.data.path if os.path.exists(p))
'/home/alvas/nltk_data'

在 linux 上,只需转到命令行上的目录:

$ cd /home/alvas/nltk_data/
$ ls
corpora  grammars  tokenizers
$ cd grammars/
$ ls
large_grammars  large_grammars.zip
$ rm -rf large_grammars 
$ rm large_grammars.zip 

关于python - 如何从 nltk 下载器中删除数据/模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43113266/

相关文章:

使用 nltk 的 python 拼写校正器

python - 一种用指定键列表对 dict 的值求和的 pythonic 方法?

python - 想要抓取所有成员(member)个人资料链接以获取成员(member)详细信息

html - 您可以设置本地文档根目录吗?或者在哪里?

python - 如何使用python检查目录中所有图像的尺寸?

python - regexp_tokenize 和阿拉伯文本

python - 内部指针方法的工作原理

c++ - 如何确定请求了哪个编译器

javascript - 什么是暂存文件?

Python NLTK : Extract lexical head item from Stanford dependency parsed result