r - 创建一个表，提供 R 中 B 列和 C 列的 A 列的平均值

<分区>

我想使用 xtabs() 函数(在 R 中)给定数据框的 3 列创建一个列联表。下面的代码适用于 2 列:

xtabs(~B + C, data = theData) #contingency table for two columns

但是当我再添加一个属性时，我得到一个错误:

xtabs(~B + C + mean(A), data = theData)

Error in model.frame.default(formula = ~B + C +  : 
  variable lengths differ (found for 'mean(A)')

例如，对于下面的数据框

输出应该是这样的:

B   C   A
b1  c1  1.5
    c2  2.0
b2  c1  7.0
    c2  4.0

创建一个表的正确方法是什么，其中一列的平均值跨越其他(不同的)两列？谢谢

最佳答案

在使用aggrregate 汇总输出后，我们可以使用xtabs

xtabs(A ~ B + C , data = aggregate(A ~ B + C, theData, FUN = mean))
#   C
#B     c1  c2
#  b1 1.5 2.0
#  b2 7.0 4.0

或者在这种情况下，输出可以只是聚合

aggregate(A ~ B + C, theData, FUN = mean)
#   B  C   A
#1 b1 c1 1.5
#2 b2 c1 7.0
#3 b1 c2 2.0
#4 b2 c2 4.0

不建议将某些值更改为空白 ""，因为它可能会导致其他步骤出现问题

关于r - 创建一个表，提供 R 中 B 列和 C 列的 A 列的平均值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61399057/