r - 使用最大值改变 IF-Else 语句

我知道这应该很容易修复，但由于某种原因，我没有得到我正在搜索的正确输出。我有一个大型数据集，我尝试根据两个条件创建一个新列，如果计数列标记为 1 并且该行具有最大付款，则创建一个标记为 1 的新列并标记其他列作为 0。我创建了一个小例子:

ex <- data.frame(EOC = c(1,1,2,2,2),EOC_cnt = c(1,1,1,0,0), pay = c(500,0,200,12,34))

我想要的是:

ex <- data.frame(EOC = c(1,1,2,2,2),EOC_cnt = c(1,1,1,0,0), pay = c(500,0,200,12,34)),EOC_cnt1 = c(1,0,1,0,0)

我有:

out <- ex %>% group_by(EOC) %>% mutate(EOC_cnt1 = ifelse(EOC_cnt ==1 & pmax(pay) , "1", "0"))

它适用于这个较小的示例，但当我将其应用于较大的数据集时，每个 EOC 组仍然没有得到一个 1。还有其他方法可以获得我想要的结果吗？

(我的 EOC_cnt 列中基本上有重复项，并且想创建一个新列，其中每个 EOC 只有一个 1)

以下是答案创建全 0 的示例:

dput(ex2)
structure(list(pay = c(342.39, 48.27, 299.96, 274.12, 342.39, 
121.36), EOC = c(1, 1, 1, 1, 1, 1), EOC_cnt = c(0, 1, 0, 0, 0, 
0)), row.names = c(NA, -6L), class = c("data.table", "data.frame"
), .internal.selfref = <pointer: 0x000001cdf95a1ef0>)

最佳答案

我们不需要ifelse，它可以用+或as.integer强制转换为二进制

ex %>% 
    group_by(EOC) %>% 
    mutate(EOC_cnt1 = +(pay == max(pay) & EOC_cnt == 1))

如果有重复项，那么我们使用match来查找第一个两个都为TRUE的位置

ex %>%
   group_by(EOC) %>%
   mutate(EOC_cnt1 =  +(row_number() %in% which(pay == max(pay) & EOC_cnt == 1)[1]))

根据新数据“ex2”，尚不清楚我们是否需要仅在“EOC_cnt”为1的元素中检查“pay”的max。在这种情况下，子集基于 'EOC_cnt' 1 值的 'pay'，取 max 并进行比较

ex2 %>% 
 group_by(EOC) %>% 
 mutate(EOC_cnt2 = +(pay == max(pay[EOC_cnt == 1]) & EOC_cnt == 1))

关于r - 使用最大值改变 IF-Else 语句，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65741186/

r - 使用最大值改变 IF-Else 语句

上一篇：azure-devops - 在部署到 Azure 应用服务之前，我是否必须压缩工件？

下一篇：html - CSS 转换属性不适用于 Mozilla Firefox