python - 通过 pandas.read_excel 跳过标题后的行范围

我知道 pandas.read_excel() 中的参数 usecols 允许您选择特定的列。

例如，我使用 pandas.read_excel() 读取了一个 Excel 文件。我的 Excel 电子表格有 1161 行。我想保留第一行(索引为 0)，并跳过第 2:337 行。似乎参数 skiprows 仅在涉及 0 索引时才有效。我尝试了几种不同的方法，但我的代码总是生成一个输出，其中所有我的 1161 行被读取，而不是仅在第 337 行之后。比如这样:

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "336",
                                        usecols = "H:BD")

这是另一种尝试:

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")

我希望数据框在原始 Excel 导入中排除第 2 行到第 337 行。

最佳答案

根据 documentation对于 pandas.read_excel，skiprows 必须是类似列表的。

试试这个来排除第 1 到 336 行:

df = pd.read_excel("file.xlsx",
                   sheet_name = "Sheet1",
                   skiprows = range(1, 337),
                   usecols = "H:BD")

注意:为此目的，range 构造函数被视为类似于list，因此不需要显式列表转换。

关于python - 通过 pandas.read_excel 跳过标题后的行范围，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49801060/

上一篇：python - 如何使用pytest-mock检查单元测试中是否调用了函数？

下一篇：python - 网络驱动程序异常 : Message: Service/usr/lib/chromium-browser/chromedriver unexpectedly exited on Raspberry-Pi with ChromeDriver and Selenium

相关文章：

python - 在 3D 中绘制正态分布

python - 如何修复 SSL 问题 SSL_CTX_use_certificate : ca md too weak on Python Zeep

python - 无法导入 plotly.figure_factory

python - numpy中两个二维数组的Numpy点积得到三维数组

php - laravel Excel 导入在列上设置标题

excel - 将字符串值传递给函数并返回集合对象 VBA

python - 如何将日期格式(星期几、月、日、年)更改为 pandas 可读格式？

对公式生成的值进行排序时，VBA 排序无法正常工作

python - Pandas Series.apply - 使用另一个系列的参数？

python - 是否有避免内存深拷贝或减少多处理时间的好方法？