R:使用 SMOTE 包 "invalid ' 标签时出现问题'"

标签 r data-mining

使用 DMwR 库中的 SMOTE 包。加载数据框后,我尝试按如下方式执行采样:

crime_bal$target <- as.factor(crime_bal$target)
crime_bal <- SMOTE(target ~ .,crime_bal,perc.under = 200, perc.over = 100)

但是总是会出现这个错误:

Error in factor(newCases[, a], levels = 1:nlevels(data[, a]), labels = levels(data[,  : 
  invalid 'labels'; length 0 should be 1 or 2
In addition: Warning messages:
1: NAs introduced by coercion 
2: NAs introduced by coercion 

我的数据集的详细信息:

> summary(crime_bal)
     text               url            target  
 Length:6326        Length:6326        0:5994  
 Class :character   Class :character   1: 332  
 Mode  :character   Mode  :character

为什么我总是会遇到错误?

最佳答案

我也遇到过类似的问题,我通过将字符串特征转为整数类型来解决。我猜它只适用于数字/因子类型的数据。即我用 1,2 替换 class_1,class_2。

关于R:使用 SMOTE 包 "invalid ' 标签时出现问题'",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33693164/

相关文章:

xml - 从 Lat Lng 到 Loop 的行驶距离

r - 数据框中按因子变量的移动平均线,其中非领先 NA 和整个因子水平作为 R 中的 NA

python - 使用 pytables 构造巨大的 numpy 数组

database - 哪个数据库用于结构化 - 大容量 - 插入+读取+汇总数据?

algorithm - 选择视频最佳场景的算法是什么?

r - 创建的包未从 NAMESPACE 文件中导入的包运行函数

r - 如何在 R 中正确编写 ifelse 语句

java - NLP文本标注存储与访问

r - 根据 R 中的值使用条件颜色进行绘图

twitter - Twitter 源的聚类