我试图用 python 训练一个randomforest
分类器。然而,在我原来的pandas.dataframe
中,有float64、object、datetime64、int64和booldtypes
(几乎所有类型的数据类型都允许) Pandas )。
- 是否有必要将bool转换为float或int?
- 对于双值对象列,我应该将其转换为bool、int或float ?哪一个会表现得更好?还是说没关系?
谢谢!
最佳答案
几乎所有 scikit-learn 估计器都会在运行算法之前将输入数据转换为 float ,无论数组中的原始类型如何。这适用于随机森林的实现。
关于python - 在 python 中训练随机森林时,哪种 dtype 表现更好?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35801638/