我的数据是有序观察,我希望在进行操作时尽可能保持排序。
回答 this question ,我在数据框中将“B”放在“A”之前。生成的宽数据按列“名称”排序,即首先是“A”,然后是“B”。
df = data.frame(name=c("B","B","A","A"),
group=c("g1","g2","g1","g2"),
V1=c(10,40,20,30),
V2=c(6,3,1,7))
gather(df, Var, Val, V1:V2) %>%
unite(VarG, Var, group) %>%
spread(VarG, Val)
name V1_g1 V1_g2 V2_g1 V2_g2
1 A 20 30 1 7
2 B 10 40 6 3
有没有办法保持原来的顺序?像这样:
name V1_g1 V1_g2 V2_g1 V2_g2
1 B 10 40 6 3
2 A 20 30 1 7
04/02 编辑:我刚刚找到了
dplyr::summarise
排序也是如此。 arrange(name, df$name)
仍然可以恢复订单。但是我想知道从包的设计中是否需要额外的排序?df %>%
group_by(name) %>%
summarise(n()) %>%
name n()
1 A 2
2 B 2
最佳答案
您可以根据原始数据框中的顺序按名称排序:
gather(df, Var, Val, V1:V2) %>%
unite(VarG, Var, group) %>%
spread(VarG, Val) %>%
arrange( order(match(name, df$name)))
# name V1_g1 V1_g2 V2_g1 V2_g2
# 1 B 10 40 6 3
# 2 A 20 30 1 7
关于r - tidyr::spread 和 dplyr::summarise 中的隐式排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29381069/