python - 用 Pandas 分组数据的堆积条形图

假设我有 pandas 数据框，它有很多功能，我对其中两个感兴趣。我将它们称为 feature1 和 feature2。

feature1 可以有三个可能的值。 feature2 可以有两个可能的值。

我需要按 feature1 分组并按具有 feature2 的每个值的行数堆叠的条形图。 (这样就会有三个堆栈，每个堆栈都有两个条)。

如何实现？

目前我有

import pandas as pd
df = pd.read_csv('data.csv')
df['feature1'][df['feature2'] == 0].value_counts().plot(kind='bar',label='0')
df['feature1'][df['feature2'] == 1].value_counts().plot(kind='bar',label='1')

但这不是我真正想要的，因为它不会堆叠它们。

最佳答案

另外，我找到了另一种方法(使用 pandas):

df.groupby(['feature1', 'feature2']).size().unstack().plot(kind='bar', stacked=True)

来源: making a stacked barchart in pandas

关于python - 用 Pandas 分组数据的堆积条形图，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34917727/

上一篇：python - 解析 CSV 以绘制股票行情数据图表

下一篇：python - 名称错误 : global name 'send_from_directory' is not defined

相关文章：

python - 用另一列的值替换字符串的一部分

algorithm - 给定一组 X-Y 坐标，用于插入缺失数据点的好算法是什么？

javascript - R 中的 "Icon"(ISOTYPE) 图表在 Javascript 中 Shiny

python - Twilio 可编程语音调用立即完成

python - 如何根据不同列中的值将一列添加到 pandas 数据框？

python - 鉴于任何纬度，长。坐标，在列表中找到最近坐标的最快方法是什么？

r - 使用 2 组数据组合连续图(R 图)

Python asyncio wait_for 同步

我自动将 Python 内容作为字段传递给类

python - TensorFlow 2.0 : how to group graph using tf. 喀拉斯？ tf.name_scope/tf.variable_scope 不再使用了吗？