R 中的递归回归(提取残差)

标签 r recursion regression lm

对于另一个问题,建议采用 X 对 Y 的递归回归过程,从前 20 个观察值开始,每次增加一个观察值,直到覆盖整个样本:

X1 <- runif(50, 0, 1)

X2 <- runif(50, 0, 10) 

Y <- runif(50, 0, 1)

df <- data.frame(X1,X2,Y)


rolling_lms <- lapply( seq(20,nrow(df) ), function(x) lm( Y ~ X1+X2, data = df[1:x , ]) )

这工作正常,但有没有办法:

  1. 获取前 20 个观测值的残差。
  2. 将每个回归的残差一一相加。

那么 21. 残差是来自包含 21 个观测值的回归的残差,22. 残差是来自包含 22 个观测值的回归的残差,依此类推?

最佳答案

这是您的问题的可能解决方案。

set.seed(1)
X1 <- runif(50, 0, 1)
X2 <- runif(50, 0, 10) 
Y <- runif(50, 0, 1)
df <- data.frame(X1,X2,Y)
rolling_lms <- lapply(seq(20,nrow(df)), function(x) lm(Y ~ X1+X2, data = df[1:x , ]))

resk <- function(k) if(k==1) rolling_lms[[k]]$residuals else tail(rolling_lms[[k]]$residuals,1)
unlist(sapply(1:length(rolling_lms), resk))

############
           1            2            3            4            5            6 
 0.051243613 -0.284725835 -0.209235819  0.677747763  0.085196300 -0.077111032 
           7            8            9           10           11           12 
-0.185700617  0.016194254  0.422214060 -0.067994796  0.265315143  0.130531648 
          13           14           15           16           17           18 
-0.083662353 -0.098826853 -0.298235953 -0.459746026  0.282954796 -0.281752756 
          19           20           21           22           23           24 
-0.037180134  0.152774597  0.576060893 -0.121303797  0.001336554 -0.357956306 
          25           26           27           28           29           30 
 0.205847757 -0.111231524 -0.082662882 -0.291013740 -0.223480493  0.051223304 
          31           32           33           34           35           36 
 0.082970698 -0.393398739 -0.428164426  0.122919273  0.457861478  0.148282532 
          37           38           39           40           41           42 
 0.081855106  0.023024731  0.500627476  0.005097244  0.189354101  0.092481013 
          43           44           45           46           47           48 
-0.245542247 -0.217881519  0.234771342 -0.023343600 -0.328489644  0.242163946 
          49           50 
-0.358311100  0.373917319 

关于R 中的递归回归(提取残差),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43805660/

相关文章:

python - statsmodels:使用 patsy 指定非线性回归模型

r - 将多个条件语句应用于一对列表或向量以分配单个字符属性

r - 根据每组的另一个查找表有条件地为一个数据框插入值?

r:将变量名作为字符串传递

r - 更改 GBM 部分图上的 x 和 y 标签

python 或 R 代码调用 mySQL 进行分层和递归查询

r - 需要 beta 回归预测和绘制曲线的示例

java - 打印子集的最佳递归算法

recursion - 理解 Elixir 中的递归

python - 给定正弦拟合的预测值