r - 线性模型残差的均值和中值

标签 r mean

我刚开始学习 R,需要一些帮助来为我的数据找到残差的均值和中值。我计算了 lm 并在总结中得到如下残差:

min       1Q        median  3Q      Max
-111.86   -34.90     -7.6   33.46   182.58

问题 :所以残差的中位数是-7.6,但这是我的意思吗?
或者是否有计算残差的均值和中位数?
我打算做 mean(resid(trees.lm) 还是应该输入 mean(trees.lm$resid)

请澄清,因为我的同学都对相同的数据集得到了不同的回答。

最佳答案

这里的一个特定问题的答案是:

mean(resid(trees.lm))

您不应该像这样深入研究拟合模型对象并剥离任意组件。当你意识到你刚刚通过以下方式提取了工作残差时,在像 GLM 这样更复杂的事情上这样做会咬你的手:
glm.mod.obj$residuals

这不太可能对您有用。

即使是像 lm() 这样简单的事情对象,什么使用 resid()或访问 $residuals可能会有所不同,具体取决于模型的拟合方式(例如 na.action 参数的设置是什么?)。

此外,线性模型假设残差是 i.i.d。均值为 0 且方差为 $\hat{\sigma}^2}$ 的高斯(或正态)随机变量,因此均值应该非常接近 0(即非常非常非常接近 0 但不完全是因为这是一台计算机和浮点运算正在发挥作用)。

关于r - 线性模型残差的均值和中值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12461429/

相关文章:

histogram - 带变换聚合的 Altair 直方图无法正确覆盖全局平均值

python - 从两个列表中找到最佳组合

python - 在包含两个元素的列表中按项目表示

r - 理解模运算符 : %% 的结果

r - 查询: Why does base R behave this way with factor()?

R:将连续 0 少于三个的字符串替换为 1

r - 如何选择R中的整行而不是第一个元素?

r - 通过移动平均滑动窗口方法,使用 rollmean、filter、rollapply 或其他 R 工具平滑 2D 矩阵

r - 如何对多列重复一个函数并将其组合在 data.frame 中并计算平均值?

R 测试那个包 : How can I see output from message() when using test_file()