一个 csv(逗号分隔)文件,其中的行有一个额外的尾随分隔符,似乎混淆了 pandas.read_csv
。 (数据文件为[1])
它将额外的分隔符视为有一个额外的列。所以比标题需要的多一列。然后 pandas.read_csv
将第一列作为行标签。总体效果是列和标题不再对齐 - 第一列成为行标签,第二列由第一个标题命名,等等。
这很烦人。知道如何告诉 pandas.read_csv
做正确的事吗?我找不到。
好书,顺便说一句。
[1]:Python for Data Analysis 一书第 9 章的 2012 FEC 选举数据库
最佳答案
对于仍在寻找它的每个人。韦斯写了一篇 blogpost对这个。如果行中有一个值太多,则会将其视为行名称,这是一个问题。
可以通过将 index_col=False
设置为 read_csv
的选项来更改此行为。
关于python - 尾随定界符混淆了 pandas read_csv,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13719946/