r - R Studio ("' 数据中的 XGBoost 错误具有类 'character' 和长度...”)

我在将数据拟合到 xgboost 分类器模型时遇到困难。当我运行这个时:

classifier = xgboost(data = as.matrix(training_set[c(4:15, 17:18,20:28)]), 
  label = training_set$posted_ind, nrounds = 10)

R Studio 告诉我:

Error in xgb.DMatrix(data, label = label, missing = missing) : 
'data' has class 'character' and length 1472000.
'data' accepts either a numeric matrix or a single filename.

训练集数据同时具有连续数据和分类数据，但所有分类数据都已按此编码(并且相同的数据适合随机森林和朴素贝叶斯模型)。我需要完成一些额外的步骤才能在 xgboost 模型中使用这些数据吗？

最佳答案

确保您的“training_set”不包含任何作为因素的列。如果您将分类变量编码为数字，但将它们转换为因子，您将收到此错误。

关于r - R Studio ("' 数据中的 XGBoost 错误具有类 'character' 和长度...”)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52320502/

上一篇：python - 朴素贝叶斯多项式模型

下一篇：python - 机器学习引擎 : Prediction Error while executing local predict command

相关文章：

r - R中混合模型(lme4)中的单级变量错误

r - 使用googleCloudStorageR的gcs_upload将文件上传到google云存储桶以实现统一的桶级访问

r - 如何连接安装在 RHEL/centOS 平台上的远程 Opencpu 服务器并使用 opencpu JS 从 R 获取结果？

python - 减少输入矩阵系数所需的时间

python - 机器学习实体候选评分(非识别)

machine-learning - 如何区分结构化数据和非结构化数据？

python - Tensorflow 在 python for 循环中太慢

在 R 中的数据帧上递归运行函数

r - 将数据框折叠成单行并根据行 R 创建新列

matlab - 如何使用两个矩阵计算余弦相似度