r - 通过独特的组合扩展数据框并计算它们的平均值

我正在尝试将行附加到具有现有类组合的数据集。然后我想计算独特的类组合的平均值。它类似于成对事后测试，但我想将其他列保留在我的数据集中。

示例数据集:

<表类=“s-表”> <标题> 类(class) 值治疗 <正文> 一个 1 1 B 2 1 c 3 1

我想要的结果:

<表类=“s-表”> <标题> 类(class) 平均值治疗 <正文> 一个 1 1 B 2 1 c 3 1 AB 1.5 1 交流 2 1 ABC 3 1 BC 2.5 1

我尝试过combn，但它没有给我我想要的数据表。我试图获得类似于 HSD.test 的输出，但不会丢失数据集的其余部分。我可以以某种方式使用 Expand.grid 函数吗？感谢您的帮助

最佳答案

您可以像这样使用combn:

do.call(c, lapply(seq_along(df$Class), \(m) combn(df$Class, m, FUN = \(x) paste(x, collapse = ""))))
#[1] "A"   "B"   "C"   "AB"  "AC"  "BC"  "ABC"

do.call(c, lapply(seq_along(df$Class), \(m) combn(df$Class, m, FUN = \(x) mean(df$Value[match(x, df$Class)])))
#[1] 1.0 2.0 3.0 1.5 2.0 2.5 2.0

在 dplyr 框架中:

library(dplyr)
df %>% 
  reframe(Mean = do.call(c, lapply(seq_along(Class), \(m) combn(Class, m, FUN = \(x) mean(Value[match(x, Class)])))), 
          Class = do.call(c, lapply(seq_along(Class), \(m) combn(Class, m, FUN = \(x) paste(x, collapse = "")))), 
          Treatment = 1) %>% 
  select(Class, Mean, Treatment)

#   Class Mean Treatment
# 1     A  1.0         1
# 2     B  2.0         1
# 3     C  3.0         1
# 4    AB  1.5         1
# 5    AC  2.0         1
# 6    BC  2.5         1
# 7   ABC  2.0         1

关于r - 通过独特的组合扩展数据框并计算它们的平均值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/75972705/

r - 通过独特的组合扩展数据框并计算它们的平均值

上一篇：python - 如何合并pandas中的重复行

下一篇：r - 根据日期和预定义值有条件地改变新列 - data.table