我以这种方式将 Excel 工作表读入 pandas DataFrame:
import pandas as pd
xl = pd.ExcelFile("Path + filename")
df = xl.parse("Sheet1")
每列的第一个单元格的值被选为dataFrame的列名,我想指定我自己的列名,我该怎么做?
最佳答案
该主题已有 5 年历史,现在已过时,但仍显示在一般搜索列表的顶部。所以我要添加这个注释。 Pandas 现在(v0.22)在解析 Excel 文件时有一个关键字来指定列名。使用:
import pandas as pd
xl = pd.ExcelFile("Path + filename")
df = xl.parse("Sheet 1", header=None, names=['A', 'B', 'C'])
如果没有设置 header=None,pd 似乎将第一行视为标题并在解析期间将其删除。如果确实有一个 header ,但您不想使用它,您有两种选择,要么 (1) 仅使用“名称”kwarg;或 (2) 使用 header=None 和 skiprows=1 的“names”。我个人更喜欢第二个选项,因为它清楚地表明输入文件不是我想要的格式,我正在做一些事情来解决它。
关于python - 使用 Pandas 读取 Excel 文件时如何指定列名?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17335649/