如何使用 R 中的 randomForest
调用结果来预测某些未标记数据的标签(例如要分类的现实世界输入)?
代码:
train_data = read.csv("train.csv")
input_data = read.csv("input.csv")
result_forest = randomForest(Label ~ ., data=train_data)
labeled_input = result_forest.predict(input_data) # I need something like this
火车.csv:
a;b;c;label;
1;1;1;a;
2;2;2;b;
1;2;1;c;
输入.csv:
a;b;c;
1;1;1;
2;1;2;
我需要得到这样的东西
a;b;c;label;
1;1;1;a;
2;1;2;b;
最佳答案
请告诉我这是否是您的意思。
您使用训练数据训练随机森林:
# Training dataset
train_data <- read.csv("train.csv")
#Train randomForest
forest_model <- randomForest(label ~ ., data=train_data)
既然随机森林已经训练完毕,您想要给它新的数据,以便它可以预测标签是什么。
input_data$predictedlabel <- predict(forest_model, newdata=input_data)
上面的代码向您的 input_data 添加一个新列,显示预测的标签。
关于r - 在 R 中使用 randomForest 包进行预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39308927/