R:使用字符串作为参数来改变dplyr中的动词

标签 r dplyr nse tidyeval

我正在构建一个 Shiny 的应用程序,该应用程序需要允许用户定义新的绘图变量。具体来说,我想允许用户定义要在变异动词中使用的表达式。服务器接收该表达式作为文本,我想知道如何在dplyr 0.7中使mutate执行它。我可以使用mutate_使其(部分)工作,但现在已弃用。它还将新列名定义为整个表达式,而不是新变量

这是一个可重现的示例:

input_from_shiny <- "Petal.ratio = Petal.Length/Petal.Width"
iris_mutated <- iris %>% mutate_(input_from_shiny)

这给出了以下内容
> head(iris_mutated)
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species Petal.ratio = Petal.Length/Petal.Width
1          5.1         3.5          1.4         0.2  setosa                                   7.00
2          4.9         3.0          1.4         0.2  setosa                                   7.00
3          4.7         3.2          1.3         0.2  setosa                                   6.50
4          4.6         3.1          1.5         0.2  setosa                                   7.50
5          5.0         3.6          1.4         0.2  setosa                                   7.00
6          5.4         3.9          1.7         0.4  setosa                                   4.25

从技术上讲,我可以使用正则表达式从字符串中提取新的变量名并相应地重命名新列,但是我想知道使用最新的dplyr版本实现它的正确方法是什么(正在读取https://cran.r-project.org/web/packages/dplyr/vignettes/programming.html,但无法弄清楚)

最佳答案

我们可以结合使用rlang::parse_quosure()!!(bang bang)来产生相同的结果:

  • parse_quosure:解析提供的字符串并将其转换为quosure
  • !!:取消对等价单的报价,以便可以通过tidyeval动词
  • 对其进行求值

    请注意,parse_quosure()已被软弃用,并根据其文档在parse_quo()中重命名为rlang 0.2.0。如果我们使用parse_quo(),我们需要为quoes指定环境,例如parse_quo(input_from_shiny, env = caller_env())
    library(rlang)
    library(tidyverse)
    
    input_from_shiny <- "Petal.ratio = Petal.Length/Petal.Width"
    iris_mutated <- iris %>% mutate_(input_from_shiny)
    
    iris_mutated2 <- iris %>% 
      mutate(!!parse_quosure(input_from_shiny))
    head(iris_mutated2)
    
    #>   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
    #> 1          5.1         3.5          1.4         0.2  setosa
    #> 2          4.9         3.0          1.4         0.2  setosa
    #> 3          4.7         3.2          1.3         0.2  setosa
    #> 4          4.6         3.1          1.5         0.2  setosa
    #> 5          5.0         3.6          1.4         0.2  setosa
    #> 6          5.4         3.9          1.7         0.4  setosa
    #>   Petal.ratio = Petal.Length/Petal.Width
    #> 1                                   7.00
    #> 2                                   7.00
    #> 3                                   6.50
    #> 4                                   7.50
    #> 5                                   7.00
    #> 6                                   4.25
    
    
    identical(iris_mutated, iris_mutated2)
    #> [1] TRUE
    

    编辑:分隔LHS和RHS

    lhs <- "Petal.ratio"
    rhs <- "Petal.Length/Petal.Width"
    
    iris_mutated3 <- iris %>% 
      mutate(!!lhs := !!parse_quosure(rhs))
    head(iris_mutated3)
    
    > head(iris_mutated3)
      Sepal.Length Sepal.Width Petal.Length Petal.Width Species
    1          5.1         3.5          1.4         0.2  setosa
    2          4.9         3.0          1.4         0.2  setosa
    3          4.7         3.2          1.3         0.2  setosa
    4          4.6         3.1          1.5         0.2  setosa
    5          5.0         3.6          1.4         0.2  setosa
    6          5.4         3.9          1.7         0.4  setosa
      Petal.ratio
    1        7.00
    2        7.00
    3        6.50
    4        7.50
    5        7.00
    6        4.25
    

    reprex package(v0.2.0)创建于2018-03-24。

    关于R:使用字符串作为参数来改变dplyr中的动词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49469982/

    相关文章:

    r - 在 R 中生成多个字符的(随机)序列

    r - 用变化的刻度进行缩放(轴限制)

    r - 如何更新 dplyr 管道中的值?

    R:循环自定义 dplyr 函数

    r - 如何在ggplot2中的fct_reorder()中使用NSE

    r - R中运行randomForest期间详细模式的说明

    r - 按组变量排列grouped_df不起作用

    r - 索引 grouped_df 对象

    r - 合并数据框并按组划分行

    r - 如何使用非标准评估 NSE 来评估 data.table 上的参数?