我正在尝试通过使用 map2
来应用 lm
来学习 purrr
的 map 功能。使用 mtcars
数据集的子集,我创建了一个包含变量名称组合的数据框,如下所示:
# Load libraries
library(dplyr)
library(purrr)
# Subset data
df <- mtcars %>% select(mpg:qsec)
# Get variable names
car_vars <- colnames(df)
# Create data frame of variable names
foo <- combn(car_vars, 2) %>% t %>% data.frame
# > head(foo)
# X1 X2
# 1 mpg cyl
# 2 mpg disp
# 3 mpg hp
# 4 mpg drat
# 5 mpg wt
# 6 mpg qsec
接下来,我有一个函数,它采用两个变量的名称并拟合线性模型:
# Fit model
fit_lm <- function(c1, c2){
lm(paste(c1, c2, sep = "~"), data = df)
}
我可以像这样用 map2
应用它:
# Fit all the models
map2(foo$X1, foo$X2, fit_lm)
给出打印时看起来像这样的 lm
对象列表:
# [[1]]
#
# Call:
# lm(formula = paste(c1, c2, sep = "~"), data = df)
#
# Coefficients:
# (Intercept) cyl
# 37.885 -2.876
太棒了!现在,这就是我绊倒的地方。我想将这些 lm
对象作为列添加到我的数据框中,这样我就可以方便地将变量名称与模型本身放在同一行中。所以,我将 dplyr
的 mutate
与 map2
一起使用。
# Not so successful
foo %>% mutate(mods = map2(X1, X2, fit_lm))
生成的 mods
列具有 NULL 类而不是 lm
并且看起来有点像 lm
的 dput
> 对象,不像我之前的(成功的)尝试。显然,我误解了 map2
的工作原理。有人可以解释我的错误吗?
最佳答案
就结果本身而言,你做的很好:
foo <- foo %>% mutate(mods = map2(X1, X2, fit_lm))
str(foo, max.level = 1)
# 'data.frame': 21 obs. of 3 variables:
# $ X1 : Factor w/ 6 levels "cyl","disp","drat",..: 5 5 5 5 5 5 1 1 1 1 ...
# $ X2 : Factor w/ 6 levels "cyl","disp","drat",..: 1 2 4 3 6 5 2 4 3 6 ...
# $ mods:List of 21
问题很简单
class(foo)
# [1] "data.frame"
lm
类的复杂列表用print.data.frame
打印得非常糟糕。因此,为了使用 print.tbl
更好地查看结果,我们只需要将 foo
转换为 tibble
:
foo <- as.tbl(foo)
foo
# A tibble: 21 x 3
# X1 X2 mods
# <fct> <fct> <list>
# 1 mpg cyl <S3: lm>
# 2 mpg disp <S3: lm>
# 3 mpg hp <S3: lm>
# 4 mpg drat <S3: lm>
# 5 mpg wt <S3: lm>
# 6 mpg qsec <S3: lm>
# 7 cyl disp <S3: lm>
# 8 cyl hp <S3: lm>
# 9 cyl drat <S3: lm>
# 10 cyl wt <S3: lm>
# … with 11 more rows
关于r - 将 lm 与 map2 一起应用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54294205/