我有一个包含 125 个变量的数据框。存在相当多的 NA,因为数据来自一项调查,该调查具有逻辑性,仅当基于先前的答案有意义时才提出问题。
我正在尝试使用“tree”包构建分类树。当我尝试构建一棵树时
t1 <- tree(outcome ~ ., data=surveyData)
我收到错误“没有可以拟合模型的观察结果”
。
我不确定如何解释此错误,并且在论坛或文档中没有找到任何内容。
我一直在尝试用一些较小的子集构建树,这似乎有效。
有人能指出我正确的方向吗?
非常感谢!
最佳答案
我发现了问题。我有一些数据列有太多 NA,这使得树函数提示。我删除了这些变量并能够创建一棵树。
我删除了有问题的列并以这种方式构建了一棵树:
naCols <- vector(length=125)
for (i in 1:125){ naCols[i]<- sum(is.na(data[,i]))}
subset <- data[,which(naCols < 10)]
myTree <- (outcome ~ ., data=subset)
我有一个更大的问题,那就是找出处理我所有 NA 的最佳方法 - 但那是另一个故事了。
关于r - "no observations from which to fit a model"错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15627678/