我在将数据拟合到 xgboost 分类器模型时遇到困难。当我运行这个时:
classifier = xgboost(data = as.matrix(training_set[c(4:15, 17:18,20:28)]),
label = training_set$posted_ind, nrounds = 10)
R Studio 告诉我:
Error in xgb.DMatrix(data, label = label, missing = missing) :
'data' has class 'character' and length 1472000.
'data' accepts either a numeric matrix or a single filename.
训练集数据同时具有连续数据和分类数据,但所有分类数据都已按此编码(并且相同的数据适合随机森林和朴素贝叶斯模型)。我需要完成一些额外的步骤才能在 xgboost 模型中使用这些数据吗?
最佳答案
确保您的“training_set”不包含任何作为因素的列。如果您将分类变量编码为数字,但将它们转换为因子,您将收到此错误。
关于r - R Studio ("' 数据中的 XGBoost 错误具有类 'character' 和长度...”),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52320502/