我正在尝试从 excel 文件中获取多级索引和列 pandas 数据框,但奇怪的是,它似乎跳过了一行。考虑以下:
这是我的代码
df = pd.read_excel(r"https://buy-and-hold-strategy.s3.eu-central-1.amazonaws.com/example.xls",
skiprows=2,
sheet_name='Sheet1',
index_col=[0, 1],
header=[0, 1])
df.head()
返回Out[46]:
b 1 2
sub 0 1 0 1
1 1
1 2 value 1.0 NaN NaN
3 NaN NaN NaN NaN
2 1 NaN NaN text 2.0
2 NaN NaN NaN NaN
3 1 NaN NaN NaN NaN
好像第一行数据1.1
存储为索引名称: df.index.names
Out[49]: FrozenList([1, 1])
最佳答案
我认为您的 excel 文件的结构有误。也许您可以像这样调整 Excel 文件的结构:
之后,您可以像以前一样阅读文件:
df = pd.read_excel((r"https://buy-and-hold-strategy.s3.eu-central-1.amazonaws.com/example.xls",
skiprows=2,
sheet_name='Sheet1',
index_col=[0,1],
header=[0,1])
df.head()
你得到以下结果:df.head()
b 1 2
sub2 0 1 0 1
q sub1
1 1 NaN NaN NaN NaN
2 value 1.0 NaN NaN
3 NaN NaN NaN NaN
2 1 NaN NaN text 2.0
2 NaN NaN NaN NaN
关于python - panda read_excel index_col 似乎跳过了一行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71237640/