python - 在 python 中训练随机森林时，哪种 dtype 表现更好？

标签 python pandas scikit-learn

我试图用 python 训练一个randomforest分类器。然而，在我原来的pandas.dataframe中，有float64、object、datetime64、int64和booldtypes(几乎所有类型的数据类型都允许) Pandas )。

是否有必要将bool转换为float或int？
对于双值对象列，我应该将其转换为bool、int或float ？哪一个会表现得更好？还是说没关系？

谢谢!

最佳答案

几乎所有 scikit-learn 估计器都会在运行算法之前将输入数据转换为 float ，无论数组中的原始类型如何。这适用于随机森林的实现。

关于python - 在 python 中训练随机森林时，哪种 dtype 表现更好？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35801638/

上一篇：python - 身份验证后，它不会重定向到 django 中的下一页

下一篇：python - 即使手动安装所有依赖项后，也无法使用 pip 安装 Seaborn

相关文章：

python - 如何使用 Pylons/Mako 模板从独立的 python 脚本制作 HTML 电子邮件？

python - Python 中 Float 错误的无效文字

python - 使用字典脚本导入 txt 文件并将其应用于数据框以替换单词

iphone - 将 django.contrib.auth.views.login 设置为 csrf_exempt

python - 基于 Pandas 中另一列的增量

python - 使用 str.contains 将字符串的一部分替换为分隔符

Python 决策树回归器

python - 多个目标的train_test_split

python - 用于无排名分类器(例如 OSVM)的 AUC-ROC

python - 解析姓名和学位？

©2024 IT工具网联系我们