python - 在 Pandas 中,read_excel() 中使用的 read_csv() 中的 'nrows' 是什么?

标签 python pandas

只想将特定范围的数据从 excel 电子表格(.xlsm 格式,因为它有宏)导入 pandas 数据框。 是这样做的:

data    = pd.read_excel(filepath, header=0,  skiprows=4, nrows= 20, parse_cols = "A:D")

但 nrows 似乎只适用于 read_csv() ? read_excel() 的等效项是什么?

最佳答案

作为noted in the documentation ,从 pandas 版本 0.23 开始,这现在是一个内置选项,并且功能几乎与 OP 所述完全相同。

代码

data = pd.read_excel(filepath, header=0, skiprows=4, nrows= 20, use_cols = "A:D")

现在将读取 excel 文件,从第一个工作表中获取数据(默认),跳过 4 行数据,然后将第一行(即工作表的第五行)作为header,将接下来的 20 行数据读入数据帧(第 6-25 行),并且只使用 A:D 列。请注意,use_cols 现在是最后一个选项,因为 parse_cols 已被弃用。

关于python - 在 Pandas 中,read_excel() 中使用的 read_csv() 中的 'nrows' 是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35747476/

相关文章:

python - 在Python中从文本文件的几个相同结构的 block 中解析数据

python - 如何为 future 的变化准备一个django项目

python - PANDAS从txt文件中读取不存在的额外列

python - 如何加快对数百万行的多个 str.contains 搜索?

python - 当 pandas 列中不存在某些类别时获取假人

python - Pandas For Loop 错误 - 嵌入了和/if 语句

python - 无法更新标签文本

python - 类型错误 : Popen not iterable

python - 缺少数据,在 Pandas 中插入行并用 NAN 填充

python - 突出显示 Excel 列中大于某个值的总和