python - Pandas 循环遍历 Excel 工作表并附加到 df

标签 python python-3.x pandas

我正在尝试循环遍历 Excel 工作表并将多个工作表中的数据附加到数据框中。

到目前为止我已经:

master_df = pd.DataFrame()
for sheet in target_sheets:
    df1 = file.parse(sheet, skiprows=4) 
    master_df.append(df1, ignore_index=True)

但是当我调用 master_df.head() 时,它返回 __

这些表上的数据格式相同且相互关联。

所以我想像这样加入他们:

表 1 包含:

A1
B1
C1

表 2 包含:

A2
B2
C2

表 3:

A3
B3
C3

最终结果:

A1
B1
C1
A2
B2
C2
A3
B3
C3

我的逻辑是否正确或者我该如何实现这一目标?

最佳答案

即使您不知道 Excel 文件中确切的sheet_names,下面的代码也可以工作。你可以试试这个:

import pandas as pd

xls = pd.ExcelFile('myexcel.xls')

out_df = pd.DataFrame()

for sheet in xls.sheet_names:
    df = pd.read_excel('myexcel.xls', sheet_name=sheet)
    out_df.append(df)  ## This will append rows of one dataframe to another(just like your expected output)

print(out_df)

## out_df will have data from all the sheets

请告诉我这是否有帮助。

关于python - Pandas 循环遍历 Excel 工作表并附加到 df,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53120491/

相关文章:

python - OpenMP和Python

python - 帮助获取 Reddit 帖子链接到的 URL With PRAW

python - 为什么在 Python 中从不同路径调用类时 __class__ 不同?

python - 从字典中调用字典中的信息

python-3.x - python |以时间间隔从网络摄像头捕获图像

python - 如何在Python中以特定的输出格式将矩阵(从一个文件读取)写入另一个csv文件

python - 迭代 float 列表

python - 获取并绘制 pandas 数据框中的唯一值计数

python - 动态过滤 Pandas 数据框

python - 使用 Pandas DataFrame 计算百分比