python - 保存 pandas pivot_table 以包含索引和列名称

标签 python pandas pivot-table export-to-csv

我想保存一个 Pandas 数据透视表供人类阅读，但是 DataFrame.to_csv不包括 DataFrame.columns.name .我怎样才能做到这一点？

示例 :

对于以下数据透视表:

>>> import pandas as pd
>>> df = pd.DataFrame([[1, 2, 3], [6, 7, 8]])
>>> df.columns = list("ABC")
>>> df.index = list("XY")
>>> df
   A  B  C
X  1  2  3
Y  6  7  8
>>> p = pd.pivot_table(data=df, index="A", columns="B", values="C")

查看数据透视表时，我们有索引名称(“A”)和列名称(“B”)。

>>> p
B    2    7
A
1  3.0  NaN
6  NaN  8.0

但是当导出为 csv 时，我们会丢失列名:

>>> p.to_csv("temp.csv")

===temp.csv===
A,2,7
1,3.0,
6,,8.0

如何获得某种人类可读的输出格式，其中包含整个数据透视表，包括 .columns.name (“乙”)？

像这样的事情会很好:

B,2,7
A,,
1,3.0,
6,,8.0

最佳答案

是的，可以通过 append helper DataFrame 来实现，但是读取文件有点复杂:

p1 = pd.DataFrame(columns=p.columns, index=[p.index.name]).append(p)
p1.to_csv('temp.csv',index_label=p.columns.name)
B,2,7
A,,
1,3.0,
6,,8.0

#set first column to index
df = pd.read_csv('temp.csv', index_col=0)
#set columns and index names
df.columns.name = df.index.name
df.index.name = df.index[0]
#remove first row of data
df = df.iloc[1:]
print (df)
B    2    7
A          
1  3.0  NaN
6  NaN  8.0

关于python - 保存 pandas pivot_table 以包含索引和列名称，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55359807/

上一篇：c - 为什么我的 C 代码只生成每三个随机数？

下一篇：r - 创建一个新变量，它是一个变量以另外两个变量为条件的平均值(并维护数据集中的所有其他变量)

相关文章：

python - Pandas 条件创建同时排除

MySQL 数据透视表的列名上的日期

vba - 从数据透视表中提取数据vba

python - Matplotlib 绘制 numpy.matrix 类型的奇怪行为

python - 从 sklearn PCA 获取特征值和向量

python - 按条件列值获取

python-3.x - 如何使用 pandas get_dummies 函数消除键错误

excel - 使用单个外部 OLAP 多维数据集加快多个数据透视表的刷新时间

tokenize 模块中的 Python 2 换行符

python - 将数据规范化为特定范围的值