r - 使用 rlm 计算稳健回归的 r 平方是否合适

标签 r statistics regression robust

我正在使用 MASS 的 rlm 函数来执行稳健的回归。与 lm 不同,summary 函数不返回 r 平方的值。

因此使用 1 - sum(residual^2)/(sum((Y-mean(Y))^2)? 来计算是合适的。

(为等式道歉,我不知道如何以更好的格式编写它)

最佳答案

当数据有很多异常值时,使用稳健线性回归(rlm)代替线性回归(lm);它还可以用于检测有影响的观察结果。
稳健回归使用迭代重加权最小二乘法 (IRLS) 进行最大似然估计 (MLE),而线性回归使用普通最小二乘法 (OLS),这就是 lm() 而不是 rlm 返回 R 平方(确定系数)的原因()。

现在谈到适当性,它不是评估稳健回归拟合的适当措施,因为它涉及计算平方损失=总和(残差^ 2)=总和(预测值 - 观察值)^ 2 在r平方的公式中.由于稳健回归涉及处理包含许多异常值的数据,因此该度量将导致荒谬的值,因为由异常值的残差产生的大值是大且平方的!
这就是为什么在涉及异常值时使用绝对损失=(预测 - 实际)来评估拟合的原因。

希望这可以帮助。

关于r - 使用 rlm 计算稳健回归的 r 平方是否合适,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60073531/

相关文章:

r - 彩色图同构 : 1(red)->2(blue) vs 1(blue)->2(red)

python - 如何在numpy中计算超过num_classes - 1 LDA方向?

r - 预测 cv.glmnet 为每一行 r 提供相同的值

r - R语言文本摘要

r - 如果在 Shiny 中发生事件时某些选项卡处于事件状态,如何停止输出代码运行?

根据带有 NA 的表删除过滤器

data-structures - 纯函数映射和集合的统计性能

postgresql - 如何获得忽略异常值的平均值?

machine-learning - 线性回归中的负系数

r - 使用 MICE 插补绘制适度回归中的交互项