r - 分类任务中的所有二元预测器

标签 r machine-learning statistics random-forest r-caret

我正在使用 R 执行分析,我将实现四种算法。

1. RF
2. Log Reg
3. SVM
4. LDA

我有 50 个预测变量和 1 个目标变量。我所有的预测变量和目标变量都只是二进制数 0 和 1。

我有以下问题:

Should I convert them all into factors?
Converting them into factors, and applying RF algorithms give 100% accuracy, I am very much surprised to see that as well.
Also, for other algorithms, how should i treat my variables priorly, before feeding them into my other algorithms.

谢谢

最佳答案

如果变量/预测变量是分类的,那么最好将它们转换为因子。否则,它们可能会被视为数值。

如果您正在执行分类任务,那么最好也将目标/响应变量作为一个因素。

最好查看您使用的函数的文档,以确保它们不会将因子转换为数值。

关于r - 分类任务中的所有二元预测器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46844180/

相关文章:

r - 如何估计 Gamma 距离的形状和尺度。具有特定均值和 95% 分位数?

r - 使用 `midasr` 包 : Inclusion of new high-frequency value 进行预测

r - 使用递增变量循环并改变多个列

machine-learning - 针对简单的一维场景推荐的异常检测技术?

scala - Spark 对象的类型参数边界很难获得

java - 如何建立一个模型来区分关于 Apple (Inc.) 的推文和关于苹果 (fruit) 的推文?

javascript - 图表的预测时间建模

python - Databricks:如何从 R Dataframe 切换到 Pandas Dataframe(R 到 python 在同一笔记本中)

r - 使用scale_color_gradientn时,ggplot2图例条目从posixct更改为整数

r - R 中的正态性检验给出奇怪的结果?