r - 在 pmap() 或 pwalk() 中为 .l 提供列表参数

标签 r purrr

我不清楚参数何时可以在 pmap() 和 pwalk() 的 .l 中显式配对。争论。有时,这些 purrr 函数似乎只在提供给它们的数据帧的名称直接映射到 .f 中命名的函数的预期参数时才起作用。 .其他时候,可以向 pmap() 提供完整的数据帧,并且可以显式地对变量进行映射。

library(dplyr)
library(purrr)
library(tibble)

set.seed(57)

ds_mt <- 
  mtcars %>% 
  rownames_to_column("model") %>% 
  mutate(am = factor(am, labels = c("auto", "manual"))) %>% 
  select(model, mpg, wt, cyl, am) %>% 
  sample_n(3)

foo <- function(model, am, mpg){
  print(
    paste("The", model, "has a", am, "transmission and gets", mpg, "mpgs.")
  )
}

为什么这些代码块有效?
ds_mt %>% 
  select(model, am, mpg) %>% 
  pwalk(
  .l = .,
  .f = foo
)

# example with explicit pair mapping
ds_mt %>% 
  mutate(
    new_var = 
      pmap(
        .l = list(model=model, am=am, mpg=mpg),
        .f = foo
      )
  )

虽然这些代码块失败了?
ds_mt %>% 
  pwalk(
  .l = list(model, am, mpg),
  .f = foo
)

ds_mt %>% 
  pwalk(
  .l = list(model=model, am=am, mpg=mpg),
  .f = foo
)

最佳答案

你的问题与pmap()无关或 pwalk() .它源于对管道和 mutate() 的一些误解。功能工作。

一、管道:
除非用点另有说明,否则管道将左侧 (LHS) 作为右侧 (RHS) 函数的第一个参数传递。
所以这有效:

ds_mt %>% 
  select(model, am, mpg) %>% 
  pwalk(
    .l = .,
    .f = foo
  )
因为您的列表(= 您的数据框,因为数据框是向量列表),它是管道的 LHS,被用作 pwalk() 的第一个参数在 RHS 上。
在这种情况下,您实际上不需要点,您可以更简单地将其编写为:
ds_mt %>% 
  select(model, am, mpg) %>% 
  pwalk(foo)
另一方面,当您尝试运行时:
ds_mt %>% 
  pwalk(
    .l = list(model, am, mpg),
    .f = foo
  )
你的 LHS 和你的 RHS 之间的连接不遵循管道的规则,所以 R 不知道是什么 model是因为您没有任何名为 model 的对象.
要使此表达式起作用,您可以在没有管道的情况下按以下方式编写它:
pwalk(
  .l = list(ds_mt$model, ds_mt$am, ds_mt$mpg),
  .f = foo
)
或者,如果你想使用管道,你必须用点替换管道的 LHS(因为它没有作为 RHS 上函数的第一个参数传递),这是代码工作所必需的,但是在这里,由于您在嵌套函数中传递 LHS,因此您还必须将 RHS 放在大括号之间,因为 R 否则会将 LHS 作为 RHS 最外层函数的第一个参数传递:
ds_mt %>% {
  pwalk(
    .l = list(.$model, .$am, .$mpg),
    .f = foo
  )
}
或者,以更紧凑的风格:
ds_mt %>% {pwalk(list(.$model, .$am, .$mpg), foo)}
总之,在管道的 LHS 上有一个对象让 R 神奇地将它应用到 RHS 的正确位置是不够的(但我认为您的困惑可能来自 dplyr 函数的情况(见下文) )。默认情况下,它用作 RHS 上函数的第一个参数(在这种情况下,您不需要任何点)。对于其他展示位置,您确实需要在需要 LHS 的每个地方都有一个点。在嵌套函数的情况下(如您在此处所使用的),您还需要将 RHS 括在花括号中,否则 R 会将 LHS 作为最外层 RHS 函数的第一个参数传递。

现在,到您的mutate()例子:
ds_mt %>% 
  mutate(
    new_var = pmap(
      .l = list(model, am, mpg),
      .f = foo
    )
  )
这个有效,因为使用较新版本的 dplyr ,在 mutate() 中调用变量时不再需要数据框和美元符号功能。所以在这里,R 并不奇怪 model是因为您处于“变异框架”中,可以这么说,R 理解 model作为含义.$modelds_mt$model .所以在这里,这与 pmap() 无关。或 pwalk()但是是 dplyr 的特殊性功能(与 summarise() 相同)。我猜这个符号的快捷方式是dplyr函数允许是什么导致你有些困惑。

最后,你所说的“显式对映射”没有效果。由于您定义了函数 foo()接受 3 个参数,只要你保持参数的顺序正确,
foo(model = model, am = am, mpg = mpg)
foo(model, am, mpg)
完全一样。但是,如果您交换参数,则确实需要明确。例如:
foo(am = am, model = model, mpg = mpg)

关于r - 在 pmap() 或 pwalk() 中为 .l 提供列表参数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53493735/

相关文章:

r - 我如何在 R 中创建一个 data.frame 玩家在游戏中一起开始的次数

r - 如何在 R 中的任意嵌套列表上替换 NULL 值?

r - map() 在每个列表项中创建一个新列

从数据帧中删除 NA,除了一列 R

r - `print` 函数在 `ifelse`

r - 获取对角线对称位置的最大值

macos - Mac OS X 版本 10.6.7 上 .parallel=TRUE 时 ddply 速度较慢

r - 带有嵌套 data.frame 的 purrr::map_df

r - 计算R中偏差的平方和

R 过滤器删除映射函数中的行