r for 循环回归 lm(y~x)

标签 r for-loop regression lm

例子:

df <- data.frame(A=1:5, B=2:6, C=3:7,D=4:8,E=5:9,F=6:10)

我想创建一个回归循环 lm(y,x) 使用像 y 列 1 和 2 以及像 x 其余列。

我的想法:

lmf <- function (y,x) {
                         f <- lm(y ~ x, data=df)
                         cbind(summary(f)$r.squared,summary(f)$coefficients)                  
                        }
 for(y in 1:3)
  {
    R<- apply(df[,3:6], 2, lmf(y,x)); R
  }

错误:model.frame.default 中的错误(公式 = y ~ x,数据 = df,drop.unused.levels = TRUE): 可变长度不同(为“x”找到)

我给出的这个例子非常小,但我的数据是 y 的 50 列和 x 的 300 列。

我想做的也一样:lm(df$1~df$3, data=df); lm(df$1~df$4, data=df),[...], lm(df$2~df$3, data=df)... 但以自动方式。此外,我想提取结果 $coefficients 和 $r.squared。

最佳答案

我有一个使用 dplyr、tidyr 和 broom 包的替代版本。 我们的想法是指定要视为 Y 和 X 的变量。根据这些 Y 和 X 集创建 2 个不同的数据集。然后 reshape 数据集,以便能够将每个 Y 与一个 X 组合。最后,对每个组合运行线性回归并将模型输出保存为数据集。

# Check whether package name is installed...
check_package <- function(package_name) {
  if (!(package_name %in% rownames(installed.packages()))) {
    install.packages(package_name, dependencies = TRUE)
  }
}

check_package("broom")
check_package("dplyr")
check_package("tidyr")

library(dplyr)
library(broom)
library(tidyr)

# example dataset (picking 4 columns)
dt <- data.frame(mtcars) %>% select(mpg, disp, cyl, wt)

# specify which columns we want as y (dependent) and x (independent)
ynames <- c("disp","mpg")
xnames <- c("cyl","wt")

# create and reshape datasets
dt1 <- dt[,ynames]
dt1 <- gather(dt1,y,yvalue)

dt2 <- dt[,xnames]
dt2 <- gather(dt2, x, xvalue)



dt1 %>% 
  group_by(y) %>%                       # group by dependent variable
  do(data.frame(.,dt2)) %>%             # combine each y with all x
  group_by(y,x)%>%                      # get combinations of y and x to regress
  do(tidy(lm(yvalue~xvalue, data=.)))   # return lm output as dataframe


#      y   x        term    estimate  std.error statistic      p.value
# 1 disp cyl (Intercept) -156.608976 35.1805064 -4.451584 1.090157e-04
# 2 disp cyl      xvalue   62.598925  5.4693168 11.445474 1.802838e-12
# 3 disp  wt (Intercept) -131.148416 35.7165961 -3.671918 9.325668e-04
# 4 disp  wt      xvalue  112.478138 10.6353299 10.575896 1.222320e-11
# 5  mpg cyl (Intercept)   37.884576  2.0738436 18.267808 8.369155e-18
# 6  mpg cyl      xvalue   -2.875790  0.3224089 -8.919699 6.112687e-10
# 7  mpg  wt (Intercept)   37.285126  1.8776273 19.857575 8.241799e-19
# 8  mpg  wt      xvalue   -5.344472  0.5591010 -9.559044 1.293959e-10

关于r for 循环回归 lm(y~x),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32231681/

相关文章:

javascript - 在 For Of 循环中使用对象

python - 将 for 循环转换为列表理解

statistics - logit 模型中的尺度参数

r - 如何在R中的函数体中插入表达式

r - 从 nnet 模型计算 AUC

r - 按名称提取节点

r - dplyr mutate rowSums 计算或自定义函数

Python for 循环不从列表中迭代 '0'

tensorflow - 如何定制 AlexNet 以适应不同的用途

python - 在 Python 中绘制回归线、置信区间和预测区间