python - 类型错误 : fit_transform() missing 1 required positional argument: 'raw_documents'

标签 python machine-learning scikit-learn feature-extraction tfidfvectorizer

我正在尝试使用 Sklearn 进行特征提取文本，但是出现错误

Type error:fit_transform() missing 1 required positional argument: 'raw_documents'

看来我必须在缺少原始文档的情况下完成一些参数，但我找不到导致错误的原因，这是我的代码:

features=TfidfVectorizer.fit_transform(data.status).toarray()
label=data.label
features.shape

在 Jupyter 笔记本控制台中运行时，出现以下错误:

    TypeError   Traceback (most recent call last)\
<ipython-input-3-614f2fa78a04> in <module>()
----> 1 features=TfidfVectorizer.fit_transform(data.status).toarray()
      2 label=data.label
      3 features.shape

TypeError: fit_transform() missing 1 required positional argument: 'raw_documents'

最佳答案

在 scikit-learn 中，带有 fit_transform 的所有内容都是某种类型的实例，也就是说，您需要首先初始化该实例，在该实例中调用 fit_transform 就好像它是一个静态方法。

因此，可以通过让 vectorizer = TfidfVectorizer() 创建实例并使用 vectorizer.fit_transform(data.status)，或者仅使用 TfidfVectorizer()直接.fit_transform(data.status)。

您可以通过查看 the docs 来了解这一点，注意到您似乎确实传递了唯一必需的参数，并回想一下 Python 中的实例方法带有一个隐式参数，通常称为 self，因此您的代码中发生的情况是将 data.status 作为 self 传递，而 raw_documents 未设置。

关于python - 类型错误 : fit_transform() missing 1 required positional argument: 'raw_documents' ，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54501667/

上一篇：python - 是否可以使用 FB Prophet 进行多元多步预测？

下一篇：python-3.x - 运行时错误 : size mismatch m1: [a x b], m2: [c x d]

相关文章：

python - 已知 x、y 的条形图

python - flask mysql db.execute 循环

python - 无法在我的 "print"语句中连接整数

machine-learning - Keras 文本预处理 - 将 Tokenizer 对象保存到文件以进行评分

python - 为什么在 python 中获取 sklearn 中的顶级预测结果不同？

python - Cython 发出 'unnecessary' 警告

python-3.x - 减少深度学习模型的输入维度

python - 简单机器学习模型训练返回Nan

python - 如何使用 TfIdfVectorizer 查找重要单词？

python - 如何在 scikit learn 中绘制多元回归的最佳拟合平面？