给定x <- cbind(c(10,15,20,20,25,30,30,30,35,40,40,40,40,45),rep(c('M','F'),7))
,我想计算类别 M 和 F 的秩和自动,而不是手动计算。我想不通的是当出现平局时如何调整排名。在这种情况下,#3 和#4 都是 20,因此共享排名值 3.5(而不是 3 和 4)。同样,#6 ~ #8 的排名值为 7,而#10 ~ #13 的排名值为 11.5。如果没有这种调整,总和将是错误的。
#Wrong
sum(which(x[,2]=='F')) # =56
sum(which(x[,2]=='M')) # =49
#Right
sum(1,3.5,5,7,9,11.5,11.5) # =56.5
sum(2,3.5,7,7,11.5,11.5,14) # =48.5
我试过了 table()
和 duplicated()
,但无法弄清楚如何将事物拼凑在一起。有什么想法吗?
编辑:感谢 konvas 的建议 rank()
, 除了 bgoldst 的解决方案外,它还有效。
最佳答案
您可以 sum()
rank()
与 aggregate()
:
x <- data.frame(age=c(10,15,20,20,25,30,30,30,35,40,40,40,40,45),sex=rep(c('M','F'),7));
aggregate(rank(age)~sex, x, sum );
## sex rank(age)
## 1 F 56.5
## 2 M 48.5
关于R:自动计算秩和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29534780/