python数据框将周数转换为月份

标签 python pandas python-datetime

我正在尝试添加一个新列,将周列转换为该周所属的适当月份。如果一周分为 2 个月,则取最大月份作为答案。

import pandas as pd

 data = {'Week': [201301, 201301, 201302, 201302, 201303],
'product': ['coke', 'fanta', 'coke' ,'sprite' ,'pepsi'],
'quantity': [1.5, 1.7, 3.6, 2.4, 2.9]}
 df = pd.DataFrame(data)

 print df
     Week product  quantity
0  201301    coke       1.5
1  201301   fanta       1.7
2  201302    coke       3.6
3  201306  sprite       2.4
4  201307   pepsi       2.9

所以输出看起来像这样。有什么想法吗?

   Week product     quantity   MonthMax
0  201301    coke       1.5       01
1  201301   fanta       1.7       01
2  201302    coke       3.6       01 
3  201305  sprite       2.4       02
4  201306   pepsi       2.9       02

尽管第 201301 周是 dec12 和 jan13 的一部分,而第 201305 周也是 jan13 和 feb13 的一部分。顺便说一句,我使用的星期格式是 yyyyww。我想我是否可以计算那个特定星期的最后一天,从而计算出月份是多少。但我怎样才能以最简单的方式做到这一点。 @阿尔科

最佳答案

一种可能的方法是将一周的最后一天转换为日期时间,然后访问该日期的月份:

df['LastDayWeek'] = pd.to_datetime((df['Week']-1).astype(str) + "6", format="%Y%U%w")

负一是因为 python 从零开始计数(http://docs.python.org/2/library/datetime.html#strftime-and-strptime-behavior),+ "6" 是每周的最后一天。
然后你得到这些天的月份:

df['MonthMax'] = pd.DatetimeIndex(df['LastDayWeek']).month

给出:

In [6]: df
Out[6]:
     Week product  quantity         LastDayWeek  MonthMax
0  201301    coke       1.5 2013-01-05 00:00:00         1
1  201302   fanta       1.7 2013-01-12 00:00:00         1
2  201304    coke       3.6 2013-01-26 00:00:00         1
3  201306  sprite       2.4 2013-02-09 00:00:00         2
4  201308   pepsi       2.9 2013-02-23 00:00:00         2

关于python数据框将周数转换为月份,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20972967/

相关文章:

python - 为什么我需要创建 `QApplication` 的对象,它在 PyQt GUI 编程中的目的是什么?

python - itertools.repeat VS itertools.cycle

python - 无法使用 tensorflow 打印正确的预测

python-3.x - 如何按索引和列比较字符串值并在数据框中应用 AND OR 逻辑?

Python dateutil 解析器解析错误的秒数

Python Selenium 设置多个 Chrome 首选项

python - pandas.DataFrame.loc ,在新列中标记数据

python - 如何使用Python更改Excel中的列格式

python - 为什么在使用 scatter() 时会出现 AttributeError 而在使用 plot() 时却不会

python - 添加年份作为 timedelta 单位来移动日期的优雅方法 - Pandas