python - 仅将一张纸加载到数据框

标签 python excel pandas openpyxl xlrd

我正在尝试使用 pandas read_excel 方法将 excel 表读入 df。 excel 文件包含 6-7 个不同的工作表。其中,2-3 张非常大。我只想从文件中读取一张 Excel 工作表。 如果我将表格复印出来并阅读,时间会减少 90%。

我读过 pandas 使用的 xlrd 总是将整张纸加载到内存中。我无法更改输入格式。

您能建议一种提高性能的方法吗?

最佳答案

这很简单。就这样做吧。

import pandas as pd
xls = pd.ExcelFile('C:/users/path_to_your_excel_file/Analysis.xlsx')
df1 = pd.read_excel(xls, 'Sheet1')
print(df1)
# etc.
df2 = pd.read_excel(xls, 'Sheet2')
print(df2)

关于python - 仅将一张纸加载到数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47922946/

相关文章:

python - 为什么计算方法只适用于一条记录?

python - 从列表的列表中提取第 n 个元素

javascript - 强制重新加载客户端网页 Django

python - 使用随机 'nicknames' 对 pandas 名称列进行匿名化

c# - 在 Excel 中更改 CellValue 中文本的字体颜色 - OpenXml

c# - 如何使用 NPOI 读取文件

excel - 当显示“插入函数/函数参数”对话框时,我可以禁用 VBA UDF 计算吗?

python - Pandas 中的日期到持续时间

python - 编写这个 for 循环的更有效方法?

python - Pandas groupby 然后填充缺失的行