有一些问题的标题与我的相似,但没有一个回答我的问题。
但是我收到以下错误:`标记数据时出错。 C 错误:第 4 行应有 1 个字段,但看到了 3
我对读取数据第 1 部分、第 2 部分或第 3 部分不感兴趣(但是我有很多这样的文件,所以我无法删除它们)。我只想读取数据 开始第 1 列、第 2 列、...第 17 列。 (假设删除前 40 行)这是我尝试过的:
data=pd.read_csv(Path)
I get the Error tokenizing data. C error.
当我尝试使用 header= None 时,我也得到了同样的结果。 我尝试了以下方法:
data=pd.read_csv(Path,error_bad_lines=False)
Error tokenizing data. C error: Buffer overflow caught
我尝试了以下操作:
data=pd.read_csv(Path,names=[column1,column2,....column17])
我收到这个错误
'utf-8' codec can't decode byte 0xf2 in position.
我不知道要使用什么编码,并且不认为这是问题所在。我想跳过 xlsx 文件的前 40 行也是如此,看来我无法将引擎更改为 python,它只能在默认引擎下工作。并能正常读取数据。谁能帮我加载和读取这些数据? `
更新:删除第 1 节、第 2 节...后,我仍然遇到标记化错误。然而,删除上述部分会使某些文件到列被损坏,也许就是这种情况。
` 更新:可以使用 pd.read_excel(Path) 读取文件,为什么我无法使用它读取它 pd.read_csv 因为它提供了比 pd.read_excel 更多的选项?
最佳答案
你可以 df=Pd.read_excel(路径,skiprows=40) 您试图实现的目标是从 read_csv 读取 excel 文件,这就是它给出错误的原因。你可以使用它,它不会给出错误
关于python - 标记数据时出错。 C错误Pandas读取xlsx文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58254315/