R : object not found

标签 r machine-learning dataset

所以我正在尝试处理从 UCI 数据集存储库获得的数据集( fertility_diagnosis )。

data = read.csv('fertility_rate.csv', header = FALSE)

summary(data)
str(data)
> str(data)
'data.frame':   100 obs. of  10 variables:
 $ V1 : num  -0.33 -0.33 -0.33 -0.33 -0.33 -0.33 -0.33 -0.33 1 1 ...
 $ V2 : num  0.69 0.94 0.5 0.75 0.67 0.67 0.67 1 0.64 0.61 ...
 $ V3 : int  0 1 1 0 1 1 0 1 0 1 ...
 $ V4 : int  1 0 0 1 1 0 0 1 0 0 ...
 $ V5 : int  1 1 0 1 0 1 0 1 1 0 ...
 $ V6 : int  0 0 0 0 0 0 -1 0 0 0 ...
 $ V7 : num  0.8 0.8 1 1 0.8 0.8 0.8 0.6 0.8 1 ...
 $ V8 : int  0 1 -1 -1 -1 0 -1 -1 -1 -1 ...
 $ V9 : num  0.88 0.31 0.5 0.38 0.5 0.5 0.44 0.38 0.25 0.25 ...
 $ V10: Factor w/ 2 levels "N","O": 1 2 1 1 2 1 1 1 1 1 ...

data[, c(V3:V6,V8)] <- sapply(data[, c(V3:V6,V8)], as.numeric)
> data[, c(V3:V6,V8)] <- sapply(data[, c(V3:V6,V8)], as.numeric)
Error in `[.data.frame`(data, , c(V3:V6, V8)) : object 'V3' not found

可以看到变量名称为 V1-V10。其中V3-V6和V9是int类型。 所以我试图将它们转换为数字类型。 但在输出中我找不到对象。

> head(data,5)
     V1   V2 V3 V4 V5 V6  V7 V8   V9 V10
1 -0.33 0.69  0  1  1  0 0.8  0 0.88   N
2 -0.33 0.94  1  0  1  0 0.8  1 0.31   O
3 -0.33 0.50  1  0  0  0 1.0 -1 0.50   N
4 -0.33 0.75  0  1  1  0 1.0 -1 0.38   N
5 -0.33 0.67  1  1  0  0 0.8 -1 0.50   O

我还尝试将回归应用于 num 类型变量,如下所示

library(caTools)
set.seed(123)
split = sample.split(data$V10, SplitRatio = 0.75)
train = subset(data, split == TRUE)
test = subset(data, split == FALSE)

lin_reg = lm(formula = V10 ~ V1+V2+V7+V9,
             data = train)
     > lin_reg = lm(formula = V10 ~ V1+V2+V7+V9,
       +              data = train)
   Warning messages:
    1: In model.response(mf, "numeric") :
      using type = "numeric" with a factor response will be ignored
    2: In Ops.factor(y, z$residuals) : ‘-’ not meaningful for factors

谁能帮助我知道我做错了什么?

最佳答案

嘿,我认为你犯了一个简单的错误,你会为此自责。您的 lm() 模型应使用语法

lm(Response(dependent).variable~Predictor(Independent).variable)

我相信您收到此错误是因为您的响应变量是因子变量而不是数字。如果您确定 v10 是您想要查看逻辑回归的响应变量( https://www.r-bloggers.com/how-to-perform-a-logistic-regression-in-r/ )。然而,我怀疑您想知道您的数字变量之一如何响应 V10 和其他一些变量而变化。它是否正确?我需要更多地了解您的变量以及您正在尝试测试的内容以进一步解释。

希望这有帮助。

关于R : object not found,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49283292/

相关文章:

python - 关联规则挖掘算法

c# - 从 Web 服务器访问 SQL 数据库的合适方法

java - 斯坦福自然语言处理 - 中文情感分析

r - 将 R 代码与 Web 服务器集成

r - 如何填充ggplot图中两条曲线之间的间隙

r - 如何在 R 中使用 map ?

快速找到远离牛群的动物的算法

python - fmin_ncg 未返回优化结果

tensorflow - 批处理、重复和洗牌对 TensorFlow 数据集有什么作用?

r - 手动颜色和条件填充而不覆盖geom_point中的position_dodge?