我已经看到了如何使用双索引,但是还没有看到如何使用两行列标题。这可能吗?
例如,第1行是一系列重复的日期:2016、2016、2015、2015
第2行是一系列重复的数据。美元销售额,单位销售额,美元销售额,单位销售额。
因此,每个“美元销售”标题实际上都与上一行中的日期相关。
随后的行是带有数据的单个项目。
有没有一种方法可以执行groupby
或可以拥有两个列标题的某种方式?最终,我想按日期排列“美元销售”作为一个系列,以便可以绘制一个漂亮的图表。不幸的是,下一个“美元销售额”值之前有多个列。 (不仅仅是一个“单位销售”列)。另外,如果我删除上面的日期行,则“日期销售”与每个日期之间都没有链接。
最佳答案
如果使用pandas.read_csv()
或pandas.read_table()
,则可以为header
参数提供索引列表,以指定要用于列标题的行。 Python将在pandas.MultiIndex
中为您生成df.columns
:
df = pandas.read_csv('DollarUnitSales.csv', header=[0,1])
您还可以使用多于两行或非连续的行来指定列标题:
df = pandas.read_table('DataSheet1.csv', header=[0,2,3])
关于python-3.x - Python Pandas,两行作为列标题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41005577/