python - 带有居中标签的堆积条形图

标签 python pandas matplotlib seaborn stacked-bar-chart

我正在尝试“稳健地”将堆叠条形图中的数据标签居中。下面给出了一个简单的代码示例和结果。如您所见,数据标签并非真正位于所有矩形的中心。我错过了什么?

import numpy as np
import matplotlib.pyplot as plt

A = [45, 17, 47]
B = [91, 70, 72]

fig = plt.figure(facecolor="white")

ax = fig.add_subplot(1, 1, 1)
bar_width = 0.5
bar_l = np.arange(1, 4)
tick_pos = [i + (bar_width / 2) for i in bar_l]

ax1 = ax.bar(bar_l, A, width=bar_width, label="A", color="green")
ax2 = ax.bar(bar_l, B, bottom=A, width=bar_width, label="B", color="blue")
ax.set_ylabel("Count", fontsize=18)
ax.set_xlabel("Class", fontsize=18)
ax.legend(loc="best")
plt.xticks(tick_pos, ["C1", "C2", "C3"], fontsize=16)
plt.yticks(fontsize=16)

for r1, r2 in zip(ax1, ax2):
    h1 = r1.get_height()
    h2 = r2.get_height()
    plt.text(r1.get_x() + r1.get_width() / 2., h1 / 2., "%d" % h1, ha="center", va="bottom", color="white", fontsize=16, fontweight="bold")
    plt.text(r2.get_x() + r2.get_width() / 2., h1 + h2 / 2., "%d" % h2, ha="center", va="bottom", color="white", fontsize=16, fontweight="bold")

plt.show()

最佳答案

导入和测试 DataFrame

import pandas as pd
import matplotlib.pyplot as plt

A = [45, 17, 47]
B = [91, 70, 72]
C = [68, 43, 13]

# pandas dataframe
df = pd.DataFrame(data={'A': A, 'B': B, 'C': C})
df.index = ['C1', 'C2', 'C3']

     A   B   C
C1  45  91  68
C2  17  70  43
C3  47  72  13

针对 matplotlib v3.4.2 进行了更新

  • 使用matplotlib.pyplot.bar_label ,这会自动将栏中的值居中。
  • 参见 How to add value labels on a bar chart使用 .bar_label 获取更多详细信息和示例。
  • 使用 pandas v1.2.4 进行测试,它使用 matplotlib 作为绘图引擎。
  • 如果条形图的某些部分将为零,请参阅我的 answer ,它展示了如何为 .bar_label() 自定义 labels
  • ax.bar_label(c, fmt='%0.0f', label_type='center') 将根据需要更改数字格式以显示无小数位。
ax = df.plot(kind='bar', stacked=True, figsize=(8, 6), rot=0, xlabel='Class', ylabel='Count')
for c in ax.containers:

    # Optional: if the segment is small or 0, customize the labels
    labels = [v.get_height() if v.get_height() > 0 else '' for v in c]
    
    # remove the labels parameter if it's not needed for customized labels
    ax.bar_label(c, labels=labels, label_type='center')

enter image description here

Seaborn 选项

Seaborn 数据帧格式

# create the data frame
df = pd.DataFrame(data={'A': A, 'B': B, 'C': C, 'cat': ['C1', 'C2', 'C3']})

    A   B   C cat
0  45  91  68  C1
1  17  70  43  C2
2  47  72  13  C3

# convert the dataframe to a long form
df = df.melt(id_vars='cat')

  cat variable  value
0  C1        A     45
1  C2        A     17
2  C3        A     47
3  C1        B     91
4  C2        B     70
5  C3        B     72
6  C1        C     68
7  C2        C     43
8  C3        C     13

轴级图

# plot
ax = sns.histplot(data=df, x='cat', hue='variable', weights='value', discrete=True, multiple='stack')

# iterate through each container
for c in ax.containers:

    # Optional: if the segment is small or 0, customize the labels
    labels = [v.get_height() if v.get_height() > 0 else '' for v in c]
    
    # remove the labels parameter if it's not needed for customized labels
    ax.bar_label(c, labels=labels, label_type='center')

enter image description here

图级图

# plot
g = sns.displot(data=df, x='cat', hue='variable', weights='value', discrete=True, multiple='stack')

# iterate through each axes
for ax in g.axes.flat:

    # iterate through each container
    for c in ax.containers:

        # Optional: if the segment is small or 0, customize the labels
        labels = [v.get_height() if v.get_height() > 0 else '' for v in c]

        # remove the labels parameter if it's not needed for customized labels
        ax.bar_label(c, labels=labels, label_type='center')

enter image description here


原始答案

  • 使用 .patches 方法解压 matplotlib.patches.Rectangle 的列表对象,一个用于堆叠条形图的每个部分。
    • 每个 .Rectangle 都有用于提取定义矩形的各种值的方法。
    • 每个 .Rectangle 都是从左到右,从下到上的顺序,所以所有的 .Rectangle 对象,对于每个级别,在迭代时按顺序出现通过 .patches.
  • 标签是使用 f-string 制作的, label_text = f'{height}',因此可以根据需要添加任何额外的文本,例如 label_text = f'{height}%'
    • label_text = f'{height:0.0f}' 将显示没有小数位的数字。

情节

plt.style.use('ggplot')

ax = df.plot(stacked=True, kind='bar', figsize=(12, 8), rot='horizontal')

# .patches is everything inside of the chart
for rect in ax.patches:
    # Find where everything is located
    height = rect.get_height()
    width = rect.get_width()
    x = rect.get_x()
    y = rect.get_y()
    
    # The height of the bar is the data value and can be used as the label
    label_text = f'{height}'  # f'{height:.2f}' to format decimal values
    
    # ax.text(x, y, text)
    label_x = x + width / 2
    label_y = y + height / 2

    # plot only when height is greater than specified value
    if height > 0:
        ax.text(label_x, label_y, label_text, ha='center', va='center', fontsize=8)
    
ax.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.)    
ax.set_ylabel("Count", fontsize=18)
ax.set_xlabel("Class", fontsize=18)
plt.show()

enter image description here

  • 要绘制水平条:
    • kind='barh'
    • label_text = f'{width}'
    • 如果宽度 > 0:
  • 署名:jsoma/chart.py

关于python - 带有居中标签的堆积条形图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41296313/

相关文章:

python os.path.getmtime() 时间不变

.net - .NET 中的 RSA 加密,python 中的解密

python - Pandas 系列使用方法

python - 如何根据另一列中的值创建有序列(尽管不是累积计数)?

python - 如何增加 Pandas 图中xticks的大小

python - 当数据在元组中时如何在 matplotlib 中绘制直方图?

行为异常的 Python 正则表达式

python - PyQt4 高亮显示

python - 我如何删除 Pandas 中的过滤器数据(数据处理)

python - 如何插入大正斜杠来标记 matplotlib 轴