python - 使用 Pandas 读取 Excel 文件时如何指定列名?

标签 python pandas

我以这种方式将 Excel 工作表读入 pandas DataFrame:

import pandas as pd

xl = pd.ExcelFile("Path + filename")
df = xl.parse("Sheet1")

每列的第一个单元格的值被选为dataFrame的列名,我想指定我自己的列名,我该怎么做?

最佳答案

该主题已有 5 年历史,现在已过时,但仍显示在一般搜索列表的顶部。所以我要添加这个注释。 Pandas 现在(v0.22)在解析 Excel 文件时有一个关键字来指定列名。使用:

import pandas as pd
xl = pd.ExcelFile("Path + filename")
df = xl.parse("Sheet 1", header=None, names=['A', 'B', 'C'])

如果没有设置 header=None,pd 似乎将第一行视为标题并在解析期间将其删除。如果确实有一个 header ,但您不想使用它,您有两种选择,要么 (1) 仅使用“名称”kwarg;或 (2) 使用 header=None 和 skiprows=1 的“names”。我个人更喜欢第二个选项,因为它清楚地表明输入文件不是我想要的格式,我正在做一些事情来解决它。

关于python - 使用 Pandas 读取 Excel 文件时如何指定列名?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17335649/

相关文章:

python - Pandas 分组日期

python - 将所有 nlp 实体提取到另一列

python - 如何创建分组条形图

python - 结合/拼接 pandas DataFrames 与条件

python - 在 python 中缩小非常大的 If 语句

python - 选择落在另一个 DataFrame 中定义的范围之间的行

python - Pandas 获取具有独特列组合的 DataFrame

python - 如何绘制 Pandas 数据框的特定列?

python - django select_related() 和 django-mptt。如何一次获取所有 sibling ?

Python Selenium - 无法通过数据标题的属性定位元素