python - 在 python 中训练随机森林时,哪种 dtype 表现更好?

标签 python pandas scikit-learn

我试图用 python 训练一个randomforest分类器。然而,在我原来的pandas.dataframe中,有float64、object、datetime64、int64和booldtypes(几乎所有类型的数据类型都允许) Pandas )。

  • 是否有必要将bool转换为floatint
  • 对于双值对象列,我应该将其转换为boolintfloat ?哪一个会表现得更好?还是说没关系?

谢谢!

最佳答案

几乎所有 scikit-learn 估计器都会在运行算法之前将输入数据转换为 float ,无论数组中的原始类型如何。这适用于随机森林的实现。

关于python - 在 python 中训练随机森林时,哪种 dtype 表现更好?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35801638/

相关文章:

python - 如何使用 Pylons/Mako 模板从独立的 python 脚本制作 HTML 电子邮件?

python - Python 中 Float 错误的无效文字

python - 使用字典脚本导入 txt 文件并将其应用于数据框以替换单词

iphone - 将 django.contrib.auth.views.login 设置为 csrf_exempt

python - 基于 Pandas 中另一列的增量

python - 使用 str.contains 将字符串的一部分替换为分隔符

Python 决策树回归器

python - 多个目标的train_test_split

python - 用于无排名分类器(例如 OSVM)的 AUC-ROC

python - 解析姓名和学位?