python - 标记数据时出错。 C错误Pandas读取xlsx文件

有一些问题的标题与我的相似，但没有一个回答我的问题。

我正在尝试读取具有以下格式的 xlsx 文件

但是我收到以下错误:`标记数据时出错。 C 错误:第 4 行应有 1 个字段，但看到了 3

我对读取数据第 1 部分、第 2 部分或第 3 部分不感兴趣(但是我有很多这样的文件，所以我无法删除它们)。我只想读取数据开始第 1 列、第 2 列、...第 17 列。 (假设删除前 40 行)这是我尝试过的:

data=pd.read_csv(Path)

I get the Error tokenizing data. C error.

当我尝试使用 header= None 时，我也得到了同样的结果。我尝试了以下方法:

data=pd.read_csv(Path,error_bad_lines=False)

Error tokenizing data. C error: Buffer overflow caught

我尝试了以下操作:

data=pd.read_csv(Path,names=[column1,column2,....column17])

我收到这个错误

'utf-8' codec can't decode byte 0xf2 in position.

我不知道要使用什么编码，并且不认为这是问题所在。我想跳过 xlsx 文件的前 40 行也是如此，看来我无法将引擎更改为 python，它只能在默认引擎下工作。并能正常读取数据。谁能帮我加载和读取这些数据？ `

更新:删除第 1 节、第 2 节...后，我仍然遇到标记化错误。然而，删除上述部分会使某些文件到列被损坏，也许就是这种情况。

` 更新:可以使用 pd.read_excel(Path) 读取文件，为什么我无法使用它读取它 pd.read_csv 因为它提供了比 pd.read_excel 更多的选项？

最佳答案

你可以 df=Pd.read_excel(路径,skiprows=40) 您试图实现的目标是从 read_csv 读取 excel 文件，这就是它给出错误的原因。你可以使用它，它不会给出错误

关于python - 标记数据时出错。 C错误Pandas读取xlsx文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58254315/