我的目标是阅读 EURUSD data (每天)到一个时间序列对象中,我可以在其中根据不规则的时间范围轻松地对信息进行切片和切 block 、聚合和重新采样。这很可能是一个简单的答案。我正在使用 Python 进行数据分析,但似乎无法弥合差距。
下载并解压后 data ,我运行以下代码:
>>> import pandas as pd
>>> df = pd.read_csv('EURUSD_day.csv', parse_dates = {'Timestamp' : ['<DATE>', '<TIME>']}, index_col = 'Timestamp')
到目前为止一切顺利。我现在有一个以时间戳为索引的漂亮数据框。
但是,这本书暗示(第 295 页)我应该能够按如下方式对数据进行子集化,以查看 2001 年的所有数据。
>>> df['2001']
但是,那是行不通的。
阅读此 question and answer告诉我可以导入时间戳:
>>> from pandas.lib import Timestamp
>>> s = df['<CLOSE>']
这似乎适用于特定的一天:
>>> s[Timestamp('2001-01-04)]
0.9506999999
然而,以下代码为我所需的 2001 年所有数据范围生成了一个值。
>>> s[Timestamp('2001')]
0.8959
我知道我缺少一些简单的、基本的东西。谁能帮忙?
谢谢, 布莱恩
最佳答案
pg 上的示例。 295 正在 Series 对象上执行,这就是使用年份进行索引的原因。使用 DataFrame,您可能希望 df.ix['2001']
获得相同的结果。
关于python - 使用 pandas 将 csv 文件中的数据读入时间序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15551102/