基于 date_time 索引值的 Python/pandas 条件语句

我有一个 Pandas 数据框，其时间序列索引基于使用 date_time 应用的日期范围，如下所示:

                     Column A
2016-11-24 00:00:00  4.0
2016-11-24 01:00:00  7.8
2016-11-24 02:00:00  95.1
2016-11-24 03:00:00  78.4
etc

我想要做的是创建一个新列，根据索引中的月份将因子应用于 A 列。

修正系数:9 月 = 1、10 月 = 2、11 月 = 3、12 月 = 4 等。

因此，在上面的示例中，由于月份是 11 月，因此结果将是:

                     Column A   Column B
2016-11-24 00:00:00  4.0        12
2016-11-24 01:00:00  7.8        23.4
2016-11-24 02:00:00  95.1       285.3
2016-11-24 03:00:00  78.4       235.2
etc

我尝试了多种解决方案，但都遇到了一些问题。有人有什么建议吗？

最佳答案

我认为你可以从 month 中减去 8然后多个，但在九月之前的几个月内，获得的数字少于1:

print (df.index.month - 8)
[3 3 3 3]

df['Column B'] = df['Column A'] * (df.index.month - 8)
print (df)
                     Column A  Column B
2016-11-24 00:00:00       4.0      12.0
2016-11-24 01:00:00       7.8      23.4
2016-11-24 02:00:00      95.1     285.3
2016-11-24 03:00:00      78.4     235.2

您还可以使用map乘以 dict，然后乘以 mul 。在此解决方案中，需要从 df.index.month 创建 Series，它返回索引为 df 的 numpy array (如果不是index，则获取所有值NaN，因为索引不匹配)。

d = {9:1,10:2,11:3,12:4}

df['Column B'] = pd.Series(df.index.month, index=df.index).map(d).mul(df['Column A'])
print (df)
                     Column A  Column B
2016-11-24 00:00:00       4.0      12.0
2016-11-24 01:00:00       7.8      23.4
2016-11-24 02:00:00      95.1     285.3
2016-11-24 03:00:00      78.4     235.2

关于基于 date_time 索引值的 Python/pandas 条件语句，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40844480/

基于 date_time 索引值的 Python/pandas 条件语句

上一篇：python - 体重转换器

下一篇：python - 比较 Pandas 中不同行之间的值