r - 编写 tidyeval 函数以重命名 dplyr 中的因子级别

标签 r ggplot2 dplyr tidyeval

我正在尝试编写一个 tidyeval 函数,该函数采用数字列,用 limit 的值替换高于特定 limit 的值,将该列转换为一个因子然后将等于 limit 的因子级别替换为名为“limit+”的级别。

例如,我尝试将 sepal.width 中大于 3 的任何值替换为 3,然后将该因子级别重命名为 3+

作为示例,以下是我尝试使其与 iris 数据集一起使用的方法。不过,fct_recode() 函数没有正确重命名因子级别。

plot_hist <- function(x, col, limit) {
  col_enq <- enquo(col)
  x %>% 
    mutate(var = factor(ifelse(!!col_enq > limit, limit,!!col_enq)),
           var = fct_recode(var, assign(paste(limit,"+", sep = ""), paste(limit))))
}

plot_hist(iris, Sepal.Width, 3)

最佳答案

要修复最后一行,我们可以使用特殊符号 :=,因为我们需要设置表达式左侧的值。对于 RHS,我们需要强制转换为字符,因为 fct_recode 需要右侧的字符向量。

library(tidyverse)


plot_hist <- function(x, col, limit) {
  col_enq <- enquo(col)

  x %>% 
    mutate(var = factor(ifelse(!!col_enq > limit, limit, !!col_enq)),
           var = fct_recode(var, !!paste0(limit, "+") := as.character(limit)))
}

plot_hist(iris, Sepal.Width, 3) %>% 
  sample_n(10)
#>     Sepal.Length Sepal.Width Petal.Length Petal.Width    Species var
#> 40           5.1         3.4          1.5         0.2     setosa  3+
#> 98           6.2         2.9          4.3         1.3 versicolor 2.9
#> 7            4.6         3.4          1.4         0.3     setosa  3+
#> 99           5.1         2.5          3.0         1.1 versicolor 2.5
#> 76           6.6         3.0          4.4         1.4 versicolor  3+
#> 77           6.8         2.8          4.8         1.4 versicolor 2.8
#> 85           5.4         3.0          4.5         1.5 versicolor  3+
#> 119          7.7         2.6          6.9         2.3  virginica 2.6
#> 110          7.2         3.6          6.1         2.5  virginica  3+
#> 103          7.1         3.0          5.9         2.1  virginica  3+

关于r - 编写 tidyeval 函数以重命名 dplyr 中的因子级别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50516952/

相关文章:

r - 如何使用 ggplot2 在 R 中绘制刺激时间直方图 (PSTH)

r - R ggplot2居中对齐多行标题

r - 在 R 中将列表作为长格式的列的 tibble?

r - 使用ggsave时遇到 "Error: $ operator is invalid for atomic vectors"

重新排序具有重复 ID 的数据框

r - dplyr 可以访问 POSTGRES 9.3.5 VIEW 吗?

R:purrr:使用 pmap 进行逐行操作,但这次涉及很多列

r - 合并两个不同大小的数据集,有条件地将同一行从较小的数据集复制到较大数据集中的几行

r - 试图解决keras中的数据维度不匹配

R 在显示或打印命名向量时抑制名称