python - 标记数据时出错。 C错误Pandas读取xlsx文件

标签 python pandas file csv xlsx

有一些问题的标题与我的相似,但没有一个回答我的问题。

我正在尝试读取具有以下格式的 xlsx 文件 enter image description here

但是我收到以下错误:`标记数据时出错。 C 错误:第 4 行应有 1 个字段,但看到了 3

我对读取数据第 1 部分、第 2 部分或第 3 部分不感兴趣(但是我有很多这样的文件,所以我无法删除它们)。我只想读取数据 开始第 1 列、第 2 列、...第 17 列。 (假设删除前 40 行)这是我尝试过的:

data=pd.read_csv(Path)

I get the Error tokenizing data. C error.

当我尝试使用 header= None 时,我也得到了同样的结果。 我尝试了以下方法:

data=pd.read_csv(Path,error_bad_lines=False)

Error tokenizing data. C error: Buffer overflow caught

我尝试了以下操作:

data=pd.read_csv(Path,names=[column1,column2,....column17])

我收到这个错误

'utf-8' codec can't decode byte 0xf2 in position.

我不知道要使用什么编码,并且不认为这是问题所在。我想跳过 xlsx 文件的前 40 行也是如此,看来我无法将引擎更改为 python,它只能在默认引擎下工作。并能正常读取数据。谁能帮我加载和读取这些数据? `

更新:删除第 1 节、第 2 节...后,我仍然遇到标记化错误。然而,删除上述部分会使某些文件到列被损坏,也许就是这种情况。

` 更新:可以使用 pd.read_excel(Path) 读取文件,为什么我无法使用它读取它 pd.read_csv 因为它提供了比 pd.read_excel 更多的选项?

最佳答案

你可以 df=Pd.read_excel(路径,skiprows=40) 您试图实现的目标是从 read_csv 读取 excel 文件,这就是它给出错误的原因。你可以使用它,它不会给出错误

关于python - 标记数据时出错。 C错误Pandas读取xlsx文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58254315/

相关文章:

python - 如何找到列表中除 NaN 之外的最后一个有效索引

python - 将多个变量断言为同一类型

python - 如何在这个 pandas 数据框中分组、排序和计算差异?

python - 如何在python中使用多处理将df的内容写入csv文件

java - Android - 获取从文件资源管理器中选择的.txt文件的真实路径

cocoa - Cocoa 中保存唯一文件的默认位置

python - Pip 安装 : can't open file pip, 或父模块 '' 未加载

python - 如何将 pandas 数据框转换为 Morris 数据集以进行引导

javascript - 如何将文本文件中的值插入 JavaScript?

python - 带分隔符的 Pandas Dataframe 到 String