machine-learning - 在 python 中使用修改后的 OneHotEncoder 将分类数据编码为虚拟变量?

标签 machine-learning scikit-learn data-science encode

这是我的代码,我试图对“X”第一列的分类数据进行虚拟编码,但这不起作用,当我访问 OneHotEncoder 文档页面时,它说 OneHotEncoder已更改。我无法弄清楚如何使用这个更改后的 OnehotEncoder

from sklearn.preprocessing import OneHotEncoder
onehotencoder=OneHotEncoder(categorical_features = [0])
X[:, 0]=onehotencoder.fit_transform(X).toarray()

最佳答案

这里有几个问题。

  • 首先,one-hot-encoder 将返回一个包含多个列的数组,而输入将为单个列。因此,您的作业将会失败。

*然后,scikit-learn 将返回一个 numpy 数组。所以不需要使用toarray

关于machine-learning - 在 python 中使用修改后的 OneHotEncoder 将分类数据编码为虚拟变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59343967/

相关文章:

python - Pandas 描述()不显示

python - PCA降低了Logistic回归的性能?

r - rpart 的混淆矩阵

python - sklearn 管道的并行化

python - 如何加速 Keras model.predict?

machine-learning - 小批量梯度只是在线梯度的总和吗?

python - 如何在 Scikit 中构建线性加性模型?

python-3.x - 如何使用包含 numpy.ndarrays 的列/列对 pandas 数据框执行 StandardScaler?

math - 如何处理平均精度边缘情况

r - 数据框的元素作为 R 中新数据框的列名