python - Pandas 本地化和转换日期时间列而不是日期时间索引

标签 python pandas datetime timezone

我有以下数据框,它由“tz-aware”Datetimeindex 索引。

In [92]: df
Out[92]: 
                                                   last_time
ts_recv
2017-02-13 07:00:01.103036+01:00  2017-02-13 16:03:23.626000
2017-02-13 07:00:03.065284+01:00  2017-02-13 16:03:23.626000
2017-02-13 07:00:13.244515+01:00  2017-02-13 16:03:23.626000
2017-02-13 07:00:17.562202+01:00  2017-02-13 16:03:23.626000
2017-02-13 07:00:17.917565+01:00  2017-02-13 16:03:23.626000
2017-02-13 07:00:21.985626+01:00  2017-02-13 16:03:23.626000
2017-02-13 07:00:28.096251+01:00  2017-02-13 16:03:23.626000
2017-02-13 07:00:32.087421+01:00  2017-02-13 16:03:23.626000
2017-02-13 07:00:33.386040+01:00  2017-02-13 16:03:23.626000
2017-02-13 07:00:43.923534+01:00  2017-02-13 16:03:23.626000

我只有一个名为 last_time 的列,它也包含时间,但作为 strings 并且在与索引中的一个(即 Europe/Paris)。

我的目标是将此列转换为正确时区的日期时间。

我试过以下方法:

In [94]: pd.to_datetime(df['last_time'])
Out[94]: 
ts_recv
2017-02-13 07:00:01.103036+01:00   2017-02-13 16:03:23.626
2017-02-13 07:00:03.065284+01:00   2017-02-13 16:03:23.626
2017-02-13 07:00:13.244515+01:00   2017-02-13 16:03:23.626
2017-02-13 07:00:17.562202+01:00   2017-02-13 16:03:23.626
2017-02-13 07:00:17.917565+01:00   2017-02-13 16:03:23.626
2017-02-13 07:00:21.985626+01:00   2017-02-13 16:03:23.626
2017-02-13 07:00:28.096251+01:00   2017-02-13 16:03:23.626
2017-02-13 07:00:32.087421+01:00   2017-02-13 16:03:23.626
2017-02-13 07:00:33.386040+01:00   2017-02-13 16:03:23.626
2017-02-13 07:00:43.923534+01:00   2017-02-13 16:03:23.626
Name: last_time, dtype: datetime64[ns]

这有效地将列转换为日期时间对象。

但以下失败

In [96]: pd.to_datetime(df['last_time']).tz_localize('America/New_York')

错误

TypeError: Already tz-aware, use tz_convert to convert.

我设法通过以下方式获得我想要的系列

In [104]: pd.Series(pd.DatetimeIndex(df['last_time'].values)
          .tz_localize('America/New_York').tz_convert('Europe/Paris'))
Out[104]: 
0   2017-02-13 22:03:23.626000+01:00
1   2017-02-13 22:03:23.626000+01:00
2   2017-02-13 22:03:23.626000+01:00
3   2017-02-13 22:03:23.626000+01:00
4   2017-02-13 22:03:23.626000+01:00
5   2017-02-13 22:03:23.626000+01:00
6   2017-02-13 22:03:23.626000+01:00
7   2017-02-13 22:03:23.626000+01:00
8   2017-02-13 22:03:23.626000+01:00
9   2017-02-13 22:03:23.626000+01:00
dtype: datetime64[ns, Europe/Paris]

然后我可以使用原始的 datetimeindex 对其重新编制索引并将其插回数据框。

但是我发现这个解决方案很脏,我想知道是否有更好的方法。

最佳答案

你几乎在那里 - 只需添加 .dt 访问器...

来源 DF:

In [86]: df
Out[86]:
                                             last_time
ts_recv
2017-02-13 06:00:01.103036  2017-02-13 16:03:23.626000
2017-02-13 06:00:03.065284  2017-02-13 16:03:23.626000
2017-02-13 06:00:13.244515  2017-02-13 16:03:23.626000
2017-02-13 06:00:17.562202  2017-02-13 16:03:23.626000
2017-02-13 06:00:17.917565  2017-02-13 16:03:23.626000
2017-02-13 06:00:21.985626  2017-02-13 16:03:23.626000
2017-02-13 06:00:28.096251  2017-02-13 16:03:23.626000
2017-02-13 06:00:32.087421  2017-02-13 16:03:23.626000
2017-02-13 06:00:33.386040  2017-02-13 16:03:23.626000
2017-02-13 06:00:43.923534  2017-02-13 16:03:23.626000

In [87]: df.dtypes
Out[87]:
last_time    object
dtype: object

转换为日期时间 + TZ:

In [88]: df['last_time'] = pd.to_datetime(df['last_time']) \
                             .dt.tz_localize('Europe/Paris') \
                             .dt.tz_convert('America/New_York')

In [89]: df
Out[89]:
                                                  last_time
ts_recv
2017-02-13 06:00:01.103036 2017-02-13 10:03:23.626000-05:00
2017-02-13 06:00:03.065284 2017-02-13 10:03:23.626000-05:00
2017-02-13 06:00:13.244515 2017-02-13 10:03:23.626000-05:00
2017-02-13 06:00:17.562202 2017-02-13 10:03:23.626000-05:00
2017-02-13 06:00:17.917565 2017-02-13 10:03:23.626000-05:00
2017-02-13 06:00:21.985626 2017-02-13 10:03:23.626000-05:00
2017-02-13 06:00:28.096251 2017-02-13 10:03:23.626000-05:00
2017-02-13 06:00:32.087421 2017-02-13 10:03:23.626000-05:00
2017-02-13 06:00:33.386040 2017-02-13 10:03:23.626000-05:00
2017-02-13 06:00:43.923534 2017-02-13 10:03:23.626000-05:00

In [90]: df.dtypes
Out[90]:
last_time    datetime64[ns, America/New_York]
dtype: object

关于python - Pandas 本地化和转换日期时间列而不是日期时间索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42722018/

相关文章:

python - Pandas ;通过划分大型数据帧的最后一列来创建新列

python - 值错误 : Grouper for <something> not 1-dimensional

python - 如何在没有索引的 Pandas 中转置数据框?

Python datetime 无法解释的秒和微秒之间的区别

python - 在日期时间的月、日、年...上查询 Mongodb

c# - 使用 TPL 的协作式多任务处理

python - (自定义用户)createsuperuser TypeError : hasattr(): attribute name must be string

postgresql - 如何在 POSTGRESQL 中从 DATE 中提取年份

python - 在字典中执行幂运算

python - Popen 混淆 - 重定向输出,方法不起作用