我有一个这样的数据框:
我想得到一个输出,如数据透视表或一组,每个问题和每个国家/地区的是/否计数(类似 excel 的计数)。
我尝试了很多方法作为df.groupby(country).value_counts()
或 df.groupby(country).sum("Yes")
但是我得不到想要的结果。
并且我想将获得的结果制作成图表,仅针对是的答案。
有人可以给我建议吗?
谢谢
最佳答案
如何对二项式变量进行groupby和计数?
我们可以使用 get_dummies
对 question1
和 question2
列中的值进行编码然后求和
每个唯一国家/地区
的编码值以获得每个问题的Yes
和No
的数量国家
counts = pd.get_dummies(df.set_index('country')).sum(level=0)
question1_no question1_yes question2_no question2_yes
country
france 0 2 2 0
italy 1 1 0 2
germany 1 0 0 1
如何制作这个情节?
过滤名称后缀为_Yes
的问题列,然后用kind=bar
调用pandas dataframe的plot
方法创建一个显示每个国家/地区对应的Yes
问题数量的条形图
counts.filter(like='_yes').plot(kind='bar')
关于python - 如何在 python 中分组和计算二项式变量?并绘制这个图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67608121/