python - 通过 pandas.read_excel 跳过标题后的行范围

标签 python excel pandas dataframe

我知道 pandas.read_excel() 中的参数 usecols 允许您选择特定的列。

例如,我使用 pandas.read_excel() 读取了一个 Excel 文件。我的 Excel 电子表格有 1161 行。我想保留第一行(索引为 0),并跳过第 2:337 行。似乎参数 skiprows 仅在涉及 0 索引时才有效。我尝试了几种不同的方法,但我的代码总是生成一个输出,其中 所有 我的 1161 行被读取,而不是仅在第 337 行之后。比如这样:

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "336",
                                        usecols = "H:BD")

这是另一种尝试:

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")

我希望数据框在原始 Excel 导入中排除第 2 行到第 337 行。

最佳答案

根据 documentation对于 pandas.read_excelskiprows 必须是类似列表的。

试试这个来排除第 1 到 336 行:

df = pd.read_excel("file.xlsx",
                   sheet_name = "Sheet1",
                   skiprows = range(1, 337),
                   usecols = "H:BD")

注意:为此目的,range 构造函数被视为类似于list,因此不需要显式列表转换。

关于python - 通过 pandas.read_excel 跳过标题后的行范围,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49801060/

相关文章:

python - 在 3D 中绘制正态分布

python - 如何修复 SSL 问题 SSL_CTX_use_certificate : ca md too weak on Python Zeep

python - 无法导入 plotly.figure_factory

python - numpy中两个二维数组的Numpy点积得到三维数组

php - laravel Excel 导入在列上设置标题

excel - 将字符串值传递给函数并返回集合对象 VBA

python - 如何将日期格式(星期几、月、日、年)更改为 pandas 可读格式?

对公式生成的值进行排序时,VBA 排序无法正常工作

python - Pandas Series.apply - 使用另一个系列的参数?

python - 是否有避免内存深拷贝或减少多处理时间的好方法?