我有一个这样的数据框:
date post
da1 a
da1 b
da2 a
da3 c
da1 d
da1 a
我想做的是:
date post total
da1 a 2
da1 b 1
da2 a 1
da3 c 1
da1 d 1
我试过:
df.groupby(["date","post"]).count().sort_values(['index'], ascending=0)
它按顺序排序,但我无法通过以下方式访问日期/发布值:df.date 或 df.post 因为所有日期/帖子成为它们自己的总值“键”。
我必须能够通过标题访问列中的值 - 我应该怎么做?
最佳答案
我认为你需要:
print (df.groupby(["date","post"]).size().reset_index(name='total'))
date post total
0 da1 a 2
1 da1 b 1
2 da1 d 1
3 da2 a 1
4 da3 c 1
关于python - 如何在考虑其他列的同时计算 .value_count() 行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41185828/