python - 将时间戳合并到自定义时间段中

我对 pandas 相当陌生，并且遇到了障碍。我有一个包含时间戳的数据帧。我想在我的数据框中添加一列，其中包含自定义期间名称(字符串)。例如:

df = pd.DataFrame(pd.date_range('01-01 00:00', periods='72', freq='H'))

我想创建一个包含自定义周期名称的列df['Periods']。例如，如果时间戳介于 01-01 00:00 和 01-02 00:00 之间，则为 Period1，Period2 否则。

我正在考虑使用 cut 但 bins 属性似乎只接受整数。

你会做什么？

谢谢。

最佳答案

在 df 初始化中，periods 必须是数字而不是字符串。

我想如何处理这个问题的方法将取决于您想要有多少个周期。

至少有几种方法:

设置周期:

from datetime import time

morning_start = time(7)
morning_end = time(12)
evening_start = time(18)
evening_end = time(22)

periods = {'morning':[morning_start, morning_end], 'evening':[evening_start, evening_end]}

方法 1。

def f(x, periods=periods):
    for k, v in periods.items():
        if x.hour >= v[0].hour and x.hour < v[1].hour:
            return k
    return 'unknown_period'

方法 2。

for k, v in periods.items():
    df['periods'] = np.where(((v[0].hour <= df.t.apply(lambda x: x.hour)) & (df.t.apply(lambda x: x.hour) <= v[1].hour)), k, 'unknown_period')

通过定义的两个周期，第一种方法的效果更快:

1000 loops, best of 3: 658 µs per loop

对比第二:

100 loops, best of 3: 3.31 ms per loop

在这两种只有两个句点的情况下，您可以将其设为单行表达式(无需循环句点):

df['periods'] = np.where((morning_start.hour <= df.t.apply(lambda x: x.hour)) & (df.t.apply(lambda x: x.hour) <= morning_end.hour), 'morning', 'evening')

关于python - 将时间戳合并到自定义时间段中，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26659637/

上一篇：python - 在 IntelliJ 上配置 Google App Engine Python 运行时

下一篇：python - 在单独的 csv 列中写入字典的值并创建标题

相关文章：

python - 这两种保存keras机器学习模型权重的方式有什么区别？

python - 比较两个 pandas dataframe 单元格，如果相等 ==，则复制其他内容 - 导致错误

python - Dataframe:如何为每一行选择不同的列

python - Pandas - 按值按索引合并行到新列

python - Pandas:加速许多字符串搜索

python - 识别时间序列数据中的更新值 Python Pandas

python - 如何在python中的输入字段后放置文本？

python - 在 if 语句检查时使线程休眠，Python Pool

python - ValueError : The last dimension of the inputs to `Dense` should be defined. 发现 `None`

python - Sqlalchemy 多对多关系 : delete the child only if there are no more references?