python - 使用 pandas 将 csv 文件中的数据读入时间序列

我的目标是阅读 EURUSD data (每天)到一个时间序列对象中，我可以在其中根据不规则的时间范围轻松地对信息进行切片和切 block 、聚合和重新采样。这很可能是一个简单的答案。我正在使用 Python 进行数据分析，但似乎无法弥合差距。

下载并解压后 data ，我运行以下代码:

>>> import pandas as pd
>>> df = pd.read_csv('EURUSD_day.csv', parse_dates = {'Timestamp' : ['<DATE>', '<TIME>']}, index_col = 'Timestamp')

到目前为止一切顺利。我现在有一个以时间戳为索引的漂亮数据框。

但是，这本书暗示(第 295 页)我应该能够按如下方式对数据进行子集化，以查看 2001 年的所有数据。

>>> df['2001']

但是，那是行不通的。

阅读此 question and answer告诉我可以导入时间戳:

>>> from pandas.lib import Timestamp
>>> s = df['<CLOSE>']

这似乎适用于特定的一天:

>>> s[Timestamp('2001-01-04)]
0.9506999999

然而，以下代码为我所需的 2001 年所有数据范围生成了一个值。

>>> s[Timestamp('2001')]
0.8959

我知道我缺少一些简单的、基本的东西。谁能帮忙？

谢谢，布莱恩

最佳答案

pg 上的示例。 295 正在 Series 对象上执行，这就是使用年份进行索引的原因。使用 DataFrame，您可能希望 df.ix['2001'] 获得相同的结果。

关于python - 使用 pandas 将 csv 文件中的数据读入时间序列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15551102/