我有一个空格分隔的 CSV 文件,格式如下:
2012-11-01 1 2012-12-01 4 2013-02-01 6
2012-12-01 2 2013-01-01 nan
2012-11-01 3 2012-12-01 5 2013-01-01 5 2013-04-01 7
基本上是日期后跟一个值,但日期很少。有些值是 nan,或者也可能丢失。我希望能够将其读入 Pandas 并根据相应的日期排列值。
奔跑的 Pandas :
import pandas as pd
pd.read_csv('sparse.csv', sep=" ", parse_dates=True)
错误:
ValueError: Expecting 6 columns, got 8 in row 1
读取此文件并对齐日期/值的方法是什么?
(我可以做一些“预处理”吗?)
谢谢
最佳答案
CSV 应包含具有相同字段数的行。如果它只是日期数字对,而对之间没有关系,则它不是 CSV,而只是对文件。因此,它应该被解析为成对的文件:
input = open("sparse.csv").read().split() # split by newlines and spaces
i = iter(input)
for date in i:
if date != "nan":
value = i.next()
# process pairs
关于python - 将稀疏csv文件读入pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13281305/