r - 将 lm 与 map2 一起应用

标签 r dplyr lm purrr

我正在尝试通过使用 map2 来应用 lm 来学习 purrr 的 map 功能。使用 mtcars 数据集的子集,我创建了一个包含变量名称组合的数据框,如下所示:

# Load libraries
library(dplyr)
library(purrr)

# Subset data
df <- mtcars %>% select(mpg:qsec) 

# Get variable names
car_vars <- colnames(df)

# Create data frame of variable names
foo <- combn(car_vars, 2) %>% t %>% data.frame

# > head(foo)
#    X1   X2
# 1 mpg  cyl
# 2 mpg disp
# 3 mpg   hp
# 4 mpg drat
# 5 mpg   wt
# 6 mpg qsec

接下来,我有一个函数,它采用两个变量的名称并拟合线性模型:

# Fit model
fit_lm <- function(c1, c2){
  lm(paste(c1, c2, sep = "~"), data = df)
} 

我可以像这样用 map2 应用它:

# Fit all the models 
map2(foo$X1, foo$X2, fit_lm)

给出打印时看起来像这样的 lm 对象列表:

# [[1]]
# 
# Call:
#   lm(formula = paste(c1, c2, sep = "~"), data = df)
# 
# Coefficients:
#   (Intercept)          cyl  
# 37.885       -2.876  

太棒了!现在,这就是我绊倒的地方。我想将这些 lm 对象作为列添加到我的数据框中,这样我就可以方便地将变量名称与模型本身放在同一行中。所以,我将 dplyrmutatemap2 一起使用。

# Not so successful
foo %>% mutate(mods = map2(X1, X2, fit_lm))

生成的 mods 列具有 NULL 类而不是 lm 并且看起来有点像 lmdput > 对象,不像我之前的(成功的)尝试。显然,我误解了 map2 的工作原理。有人可以解释我的错误吗?

最佳答案

就结果本身而言,你做的很好:

foo <- foo %>% mutate(mods = map2(X1, X2, fit_lm))
str(foo, max.level = 1)
# 'data.frame': 21 obs. of  3 variables:
#  $ X1  : Factor w/ 6 levels "cyl","disp","drat",..: 5 5 5 5 5 5 1 1 1 1 ...
#  $ X2  : Factor w/ 6 levels "cyl","disp","drat",..: 1 2 4 3 6 5 2 4 3 6 ...
#  $ mods:List of 21

问题很简单

class(foo)
# [1] "data.frame"

lm 类的复杂列表用print.data.frame 打印得非常糟糕。因此,为了使用 print.tbl 更好地查看结果,我们只需要将 foo 转换为 tibble:

foo <- as.tbl(foo)
foo
# A tibble: 21 x 3
#    X1    X2    mods    
#    <fct> <fct> <list>  
#  1 mpg   cyl   <S3: lm>
#  2 mpg   disp  <S3: lm>
#  3 mpg   hp    <S3: lm>
#  4 mpg   drat  <S3: lm>
#  5 mpg   wt    <S3: lm>
#  6 mpg   qsec  <S3: lm>
#  7 cyl   disp  <S3: lm>
#  8 cyl   hp    <S3: lm>
#  9 cyl   drat  <S3: lm>
# 10 cyl   wt    <S3: lm>
# … with 11 more rows

关于r - 将 lm 与 map2 一起应用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54294205/

相关文章:

r - 尝试计算相关矩阵时如何解释此错误的含义?

r - 在 R 的工作目录中生成子文件夹的路径字符串

javascript - 如何在 Shiny 的某些单元格中创建带有空格的类似矩阵的复选框组?

R基于两列合并或查找单元格值

根据具有数据帧作为输入的另一列替换列的值

r - 在 Mutate Dplyr 中使用通配符

r - 选定列的 mutate_each

r - logLik.lm() : Why does R use (p + 1) instead of p for degree of freedom?

R - 在每个数据框行上应用 lm

r - 从 .lm.fit() 计算 p 值的快速方法