machine-learning - 在 python 中使用修改后的 OneHotEncoder 将分类数据编码为虚拟变量？

标签 machine-learning scikit-learn data-science encode

这是我的代码，我试图对“X”第一列的分类数据进行虚拟编码，但这不起作用，当我访问 OneHotEncoder 文档页面时，它说 OneHotEncoder已更改。我无法弄清楚如何使用这个更改后的 OnehotEncoder。

from sklearn.preprocessing import OneHotEncoder
onehotencoder=OneHotEncoder(categorical_features = [0])
X[:, 0]=onehotencoder.fit_transform(X).toarray()

最佳答案

这里有几个问题。

首先，one-hot-encoder 将返回一个包含多个列的数组，而输入将为单个列。因此，您的作业将会失败。

*然后，scikit-learn 将返回一个 numpy 数组。所以不需要使用toarray。

最后，您可能希望对某些列应用编码，并让其他一些列保持不变(或者可能应用其他处理)。在这种情况下，您需要使用所谓的 ColumnTransformer 。您可以看下面的例子，它完美地说明了如何进行这样的预处理:https://scikit-learn.org/stable/auto_examples/compose/plot_column_transformer_mixed_types.html#sphx-glr-auto-examples-compose-plot-column-transformer-mixed-types-py

关于machine-learning - 在 python 中使用修改后的 OneHotEncoder 将分类数据编码为虚拟变量？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59343967/

上一篇：python - 为什么我得到 "AttributeError: ' KerasClassifier' object has no attribute 'call' ？

下一篇：machine-learning - 从头开始的随机森林回归

相关文章：

python - Pandas 描述()不显示

python - PCA降低了Logistic回归的性能？

r - rpart 的混淆矩阵

python - sklearn 管道的并行化

python - 如何加速 Keras model.predict？

machine-learning - 小批量梯度只是在线梯度的总和吗？

python - 如何在 Scikit 中构建线性加性模型？

python-3.x - 如何使用包含 numpy.ndarrays 的列/列对 pandas 数据框执行 StandardScaler？

math - 如何处理平均精度边缘情况

r - 数据框的元素作为 R 中新数据框的列名

machine-learning - 在 python 中使用修改后的 OneHotEncoder 将分类数据编码为虚拟变量？

上一篇：python - 为什么我得到 "AttributeError: ' KerasClassifier' object has no attribute '__call__' ？

下一篇：machine-learning - 从头开始的随机森林回归

上一篇：python - 为什么我得到 "AttributeError: ' KerasClassifier' object has no attribute 'call' ？