python - 高效地逐行读取Excel文件

标签 python pandas

我正在尝试处理一个包含约 600k 行和约 10 列的 Excel 文件。

我想逐行(或逐行)执行一些程序,就像它是一个迭代器(如txt/csv文件)一样。但是,如果我使用 xlrdpandas 读取 Excel 文件,打开文件大约需要 2-3 分钟。

我想知道是否可以高效地逐行读取excel文件,这样,例如,我可以用前10行验证我的程序,而不必每次试验都等待很长时间。

编辑:感谢您建议在处理之前将 Excel 文件转换为 csv。但是,我必须为用户创建一个一键式程序。所以,如果可能的话,我还是希望能找到一种直接高效读取excel文件的方法。

最佳答案

Pandas read_excel有一个nrows参数来控制将读取的行数。 pd.read_excel(your_xslx_file.xlsx, nrows=10)

您可以读取所需的行数,如果需要开始进一步读取文件,可以使用参数 skiprows 进行控制。

关于python - 高效地逐行读取Excel文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60966543/

相关文章:

python 3 : Class inheritance and private fields

python - 如何在PySide的浏览器示例中添加工具栏?

pandas - 合并 Pandas 数据框 : how to add columns and replace values

python - 如何使用 python 组合 df 的行?

python - 安全地迭代 WeakKeyDictionary 和 WeakValueDictionary

python - Dataflow BigQuery 插入作业因大数据集而立即失败

python - SWIG 使 Python 崩溃

Pandas 在自定义开始时间戳重新采样

python - 获取 Pandas 数据框的子集时出现异常

python - 系列与 Pandas 中 DataFrame 的每一列的关联,矢量化