python - 在 svm 中预测多类

标签 python machine-learning scikit-learn svm text-classification

我有像这样的用户评论数据集

review-1, 0,1,1,0,0

review-1 是用户评论,0,1,1,0,0 是评论类别。一篇评论可以有多个类别。我想预测评论的类别。所以我实现了代码

transformer = TfidfVectorizer(lowercase=True, stop_words=stop, max_features=500)
X = transformer.fit_transform(df.Review)

X_train, X_test, y_train, y_test = train_test_split(X, df.iloc[:, 1:6],
                                                test_size=0.25, random_state=42)

SVM = svm.SVC()
SVM.fit(X_train, y_train)

但是我遇到了这样的错误

ValueError: bad input shape (75, 5)

谁能提出任何好的解决方案来解决这个问题?

最佳答案

您可以使用二元分类器(如 svm.SVC())通过 OneVsRestClassifier 解决多标签分类问题。

示例:

from sklearn.multiclass import OneVsRestClassifier

from sklearn.svm import SVC

cls = OneVsRestClassifier(estimator=SVC(gamma ='auto'))

import numpy as np
cls.fit(np.random.rand(20,10),np.random.binomial(1,0.2,size=(20,5)))

关于python - 在 svm 中预测多类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54665028/

相关文章:

python - 计算列表与列表的 pandas 列的交集长度

python - 覆盖模型上的 __getattr__ 会破坏 django-model-utils InheritanceManager

python - 在 django 项目中显示来自 views.py 的表格

apache - 简单地更改 apache Mahout 分类器输入中的 csv header 会产生不同的模型?

machine-learning - 词频特征归一化

python - scikit-learn决策树重要特征顺序和最大深度选择关系

python - 将嵌入式 python asyncio 集成到 boost::asio 事件循环中

r - 在 R adabag 中设置 bagging

Python sklearn 多标签分类 : UserWarning: Label not 226 is present in all training examples

python - 确定 k 均值聚类的准确性