当标签编码数字
[1, 1, 2, 6]
LabelEncoder
返回 [0,0,1,2]
因为它对类进行排序
通过保留原始顺序获得 [1,1,0,2]
的最佳方法是什么
尝试过 - CategoricalIndex
,其工作方式相同
from sklearn import preprocessing
le = preprocessing.LabelEncoder()
le.fit([2, 1, 2, 6])
# le.classes_ [1,2,6]
le.transform([1, 1, 2, 6])
最佳答案
我们可以使用分解
pd.factorize([2, 1, 2, 6])[0]
array([0, 1, 0, 2])
关于pandas - 标签编码时保持顺序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57066624/