我有一个数据框,其中一列中有重复的条目。我想根据那一栏总结其他栏。我希望摘要在制作摘要时考虑每个唯一条目而不是总数。 例如在下面的数据框示例中,如果我想回答关于有多少人被调查是年轻人,中年人和老年人的问题?“RefID”1-1在汇总时被视为1的计数"ageclass"=young 并且不被解释为计数为 5。
RefID Altitude Sex ageclass
1-1 Low F young
1-1 Low F young
1-1 Low F young
1-1 Low F young
1-1 Low F young
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-2 Low F midage
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-3 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-4 Low F old
1-5 Low F old
1-5 Low F old
1-5 Low F old
1-5 Low F old
1-5 Low F old
1-5 Low F old
1-5 Low F old
1-7 Low F old
1-7 Low F old
1-7 Low F old
1-7 Low F old
1-8 Low F old
1-8 Low F old
1-9 Low F old
1-9 Low F old
1-9 Low F old
谢谢。
最佳答案
plyr
包对此很有用。例如。你可以这样做:
> require(plyr)
> ddply( df, .(ageclass), summarise, Num = length(unique(RefID)))
ageclass Num
1 midage 1
2 old 6
3 young 1
关于r - 汇总忽略重复的数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5016418/