python - 尾随定界符混淆了 pandas read_csv

标签 python pandas numpy csv delimiter

一个 csv(逗号分隔)文件,其中的行有一个额外的尾随分隔符,似乎混淆了 pandas.read_csv。 (数据文件为[1])

它将额外的分隔符视为有一个额外的列。所以比标题需要的多一列。然后 pandas.read_csv 将第一列作为行标签。总体效果是列和标题不再对齐 - 第一列成为行标签,第二列由第一个标题命名,等等。

这很烦人。知道如何告诉 pandas.read_csv 做正确的事吗?我找不到。

好书,顺便说一句。


[1]:Python for Data Analysis 一书第 9 章的 2012 FEC 选举数据库

最佳答案

对于仍在寻找它的每个人。韦斯写了一篇 blogpost对这个。如果行中有一个值太多,则会将其视为行名称,这是一个问题。

可以通过将 index_col=False 设置为 read_csv 的选项来更改此行为。

关于python - 尾随定界符混淆了 pandas read_csv,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13719946/

相关文章:

python - 在Python中读取.tsv文件时忽略字符串

javascript - 在 Flask 中操作和显示用户上传的图像

python - 如何在 Python 3 中分割文本

python - 最小化Python函数,在小区间内保持恒定

python - 单个 Dataframe 单元格中系列的最大值

python - 如何使用 np.where 更改多个列值?

python - 将 24 小时值转换为 HHMMSS - 时间

Python数据框用n个元素的列表替换最后n行

python - Pandas 滚动窗口似乎向滚动数据引入了偏移量

pandas - 需要一种方法将字符串 pandas 拆分为带有数字的列