nltk - 如何在 Google Colab 上安装模型/下载包?

标签 nltk spacy google-colaboratory

我正在使用文本分析库“Spacy”。我已经在 Google Colab 笔记本上安装了 spacy,没有任何问题。但要使用它,我需要下载“en”模型。

通常,该命令应如下所示:

python -m spacy download en

我尝试了几种方法,但无法将其安装在笔记本上。寻求帮助。

干杯

最佳答案

如果您有 Python 解释器但没有终端,您可以尝试:

import spacy.cli
spacy.cli.download("en_core_web_sm")

可在此处找到更多手动替代方案:https://spacy.io/usage/models#download-pip

从根本上说,需要下载、解压缩模型文件并将其放入适当的站点包目录中。您应该能够找到一种方便的方法来做到这一点,例如通过 pip 直接安装模型包。但是如果你真的卡住了,你可以通过查看 __file__ 来获得路径。您已安装的任何模块的变量,例如print(spacy.__file__ ) .这应该会告诉您 site-packages 目录在文件系统上的什么位置。

关于nltk - 如何在 Google Colab 上安装模型/下载包?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49259404/

相关文章:

python - 属性错误 : module 'PIL.Image' has no attribute 'register_extensions'

python - 使用 Google Sheets 触发位于 Google Drive 中的 Python 脚本

python-3.x - 在没有 nltk.download() 的情况下使用 nltk 访问 wordnet 文件

python - SpaCy 将新行 (\n) 标记为 GPE 命名实体

python - 使用 nltk.word_tokenize 在 pandas 数据框中生成错误 "expected string or bytes-like object"

python - SpaCyOS错误: [E050] Can't find model 'en' on Heroku platform

python - 在 sklearn 管道中使用 spacy 作为分词器

python - 使用 IPython.display.Latex 时,LaTeX 方程不会在 google Colaboratory 中呈现

python - “PlaintextCorpusReader”对象没有属性 'files'

python - 通过删除 Python 中的子集来折叠短语列表