python - 如何可视化 Pandas 中的缺失值模式

标签 python pandas matplotlib missing-data

我知道有一些用于可视化缺失值的软件包,例如 missingno。如何使用 Pandas 和 Matplotlib 可视化缺失值模式而不需要额外的包?我期望类似于下图的内容,其中缺失的数据为白色:

enter image description here

最佳答案

您可以使用 matplot 获得所需的内容:

import pandas as pd
plt.rcParams["figure.figsize"] = (20, 10)
df = pd.read_excel("C:/Users/Jhonny/Desktop/titanic.xlsx")
plt.imshow(df.isnull(), cmap='hot', aspect='auto')
plt.show()

注意:我使用了来自 kaggle 的泰坦尼克号数据的子集。

结果:

从索引 0 开始,此热图可视化立即告诉我们缺失值的分布方式(以及位置)。

enter image description here

我知道,我现在不太喜欢。 Matplot 需要更多的工作才能将这个原始图形变成更好的东西。

但是如果你想要更好更快的东西,我强烈建议seaborn

Seaborn是一个基于matplotlib的Python数据可视化库。它提供了一个高级界面,用于绘制有吸引力且信息丰富的统计图形。

import seaborn as sns
sns.heatmap(df.isnull(), cbar=False)
plt.show()

enter image description here

关于python - 如何可视化 Pandas 中的缺失值模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69539114/

相关文章:

python - 为什么我在 matplotlib 的 x 轴上得到垃圾日期值?

Python:同时两个循环

Python PIL : Make pixels outside a polygon transparent

python - 通过另一列 pandas 找到列组的最大值

python - matplotlib从左到右到下显示图像(matlab蒙太奇)

python - 如何使内嵌图的标题可复制?

python - mkdir 权限被拒绝

python - 在python中重新排序文件名

python - 避免 Pandas DataFrame 中 for 循环的有效方法

python - 在 pandas 中映射数据框中的组名称