python - 没有日期的 pandas.read_csv parse_dates

标签 python parsing pandas

我正在读取具有这种结构的 csv 文件:

2008,1,283.7,8
2008,2,323.1,8
2008,3,270.7,2
2008,4,353.6,2

年、月、数据、观察

我正在通过这种方式使用 read_csv 函数读取它:

df_in = pd.read_csv(file, header=None, index_col='Date', parse_dates={'Date': [0, 1]})

代码没有任何问题,只是所有日期的日期是我运行代码的日期,即今天是4月26日,示例的索引是:

                   2  3
   Date               
   2008-01-26  283.7  8
   2008-02-26  323.1  8
   2008-03-26  270.7  2
   2008-04-26  353.6  2

我需要索引的日期是每个月的第一天。

                  2  3
   Date               
   2008-01-1  283.7  8
   2008-02-1  323.1  8
   2008-03-1  270.7  2
   2008-04-1  353.6  2

谢谢你的帮助。

最佳答案

我会执行以下操作:

data = """
year,month,x1,x2
2008,1,283.7,8
2008,2,323.1,8
2008,3,270.7,2
2008,4,353.6,2
""" 

df = pd.read_csv(StringIO(data),header=True,                           
                 parse_dates={'date':[0,1]},
                 index_col='date')
df.index = df.index.values.astype('datetime64[M]')
print df

               x1  x2
2008-01-01  283.7   8
2008-02-01  323.1   8
2008-03-01  270.7   2
2008-04-01  353.6   2

关于python - 没有日期的 pandas.read_csv parse_dates,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23313568/

相关文章:

node.js - 上传数据时暂停 Node csv-parser

python - 更好的 Python Pandas 解决方案

python - 为什么我在编码代码上调用 exec 的函数会给出有关全局的错误?

python - 事后清理存储在源存储库中的 virtualenv 中的 .pyc 文件吗?

java - Json 元素的更改导致代码错误

python - GroupBy Pandas 计算连续的零

Python Pandas : Calculating exponentially weighted lagged squared returns (variance)

python - 如何使用未标记的数据集进行序列标记

python - 通过Python使用导出按钮下载

Python解析网络