我刚开始学习 R,需要一些帮助来为我的数据找到残差的均值和中值。我计算了 lm 并在总结中得到如下残差:
min 1Q median 3Q Max
-111.86 -34.90 -7.6 33.46 182.58
问题 :所以残差的中位数是-7.6,但这是我的意思吗?
或者是否有计算残差的均值和中位数?
我打算做 mean(resid(trees.lm) 还是应该输入 mean(trees.lm$resid)
请澄清,因为我的同学都对相同的数据集得到了不同的回答。
最佳答案
这里的一个特定问题的答案是:
mean(resid(trees.lm))
您不应该像这样深入研究拟合模型对象并剥离任意组件。当你意识到你刚刚通过以下方式提取了工作残差时,在像 GLM 这样更复杂的事情上这样做会咬你的手:
glm.mod.obj$residuals
这不太可能对您有用。
即使是像
lm()
这样简单的事情对象,什么使用 resid()
或访问 $residuals
可能会有所不同,具体取决于模型的拟合方式(例如 na.action
参数的设置是什么?)。此外,线性模型假设残差是 i.i.d。均值为 0 且方差为 $\hat{\sigma}^2}$ 的高斯(或正态)随机变量,因此均值应该非常接近 0(即非常非常非常接近 0 但不完全是因为这是一台计算机和浮点运算正在发挥作用)。
关于r - 线性模型残差的均值和中值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12461429/