假设我有 pandas
数据框,它有很多功能,我对其中两个感兴趣。我将它们称为 feature1
和 feature2
。
feature1
可以有三个可能的值。
feature2
可以有两个可能的值。
我需要按 feature1
分组并按具有 feature2
的每个值的行数堆叠的条形图。 (这样就会有三个堆栈,每个堆栈都有两个条)。
如何实现?
目前我有
import pandas as pd
df = pd.read_csv('data.csv')
df['feature1'][df['feature2'] == 0].value_counts().plot(kind='bar',label='0')
df['feature1'][df['feature2'] == 1].value_counts().plot(kind='bar',label='1')
但这不是我真正想要的,因为它不会堆叠它们。
最佳答案
另外,我找到了另一种方法(使用 pandas):
df.groupby(['feature1', 'feature2']).size().unstack().plot(kind='bar', stacked=True)
关于python - 用 Pandas 分组数据的堆积条形图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34917727/