excel - 使用 Python3 从大型 .xlsx 中高效提取工作表名称和列名称

有哪些 Python3 选项可以有效地(性能和内存)提取工作表名称和给定工作表，以及来自非常大的 .xlsx 文件的列名？

我试过使用 Pandas :

对于使用 pd.ExcelFile 的工作表名称:

    xl = pd.ExcelFile(filename)
    return xl.sheet_names

对于使用 pd.ExcelFile 的列名:

    xl = pd.ExcelFile(filename)
    df = xl.parse(sheetname, nrows=2, **kwargs)
    df.columns

对于使用 pd.read_excel 的列名有和没有nrows (>v23):

    df = pd.read_excel(io=filename, sheet_name=sheetname, nrows=2)
    df.columns

然而，pd.ExcelFile和 pd.read_excel似乎在内存中读取了整个 .xlsx，因此速度很慢。

非常感谢!

最佳答案

这是我可以与您分享的最简单的方法:

# read the sheet file
import pandas as pd
my_sheets = pd.ExcelFile('sheet_filename.xlsx')
my_sheets.sheet_names

关于excel - 使用 Python3 从大型 .xlsx 中高效提取工作表名称和列名称，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51783141/

相关文章：

vba - 禁用形状的右键菜单