python - 将稀疏csv文件读入pandas

我有一个空格分隔的 CSV 文件，格式如下:

2012-11-01 1 2012-12-01 4 2013-02-01 6
2012-12-01 2 2013-01-01 nan
2012-11-01 3 2012-12-01 5 2013-01-01 5 2013-04-01 7

基本上是日期后跟一个值，但日期很少。有些值是 nan，或者也可能丢失。我希望能够将其读入 Pandas 并根据相应的日期排列值。

奔跑的 Pandas :

import pandas as pd
pd.read_csv('sparse.csv', sep=" ", parse_dates=True)

错误:

ValueError: Expecting 6 columns, got 8 in row 1

读取此文件并对齐日期/值的方法是什么？

(我可以做一些“预处理”吗？)

谢谢

最佳答案

CSV 应包含具有相同字段数的行。如果它只是日期数字对，而对之间没有关系，则它不是 CSV，而只是对文件。因此，它应该被解析为成对的文件:

input = open("sparse.csv").read().split() # split by newlines and spaces
i = iter(input)
for date in i:
    if date != "nan":
        value = i.next()
        # process pairs

关于python - 将稀疏csv文件读入pandas，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13281305/

上一篇：python - 生成具有多个列的.CSV-使用字典吗？

下一篇：python - 如何防止命令窗口在程序执行完毕后关闭

相关文章：

python - Python 是否解包原子性 w.r.t.中断？

Python CSV 到 JSON 数组对象，将 CSV 中的唯一值作为一个 JSON 对象，其中多个对象

sql-server - 使用 PowerShell 将 CSV 文件中的数据导入带有附加列的 SQL Server

iOS 9 - Swift - 将数据写入 FileStorage - 每个字段的前缀为 "Optional"

python - 是否有代码可以对列中包含的相似单词进行分组

python - Pandas 合并TypeError : object of type 'NoneType' has no len()

python - 计算数据框列中列表项的出现次数，按另一列分组

python - 在 IronPython 中重现 PIPE 功能

python - 如何解决读取虹膜数据时出现超时错误？

Python - 建模概率