python - 使用 pandas 从标准化 csv 中提取下采样时间序列

标签 python pandas

我有一个来自 CSV 的数据框,如下所示(此处的示例数据: http://www.speedyshare.com/9A2zf/download/sample.csv ):

                          event    name          user  count  amount  commission
2011-05-23 00:00:00  2011-07-22  normal  reading_arts      2      26         0.0
2011-05-23 00:00:00  2011-07-23  normal  reading_arts     14     182         0.0
2011-05-24 00:00:00  2011-07-22  normal  reading_arts      4      52         0.0
2011-05-24 00:00:00  2011-07-22  normal  reading_arts      3      39         0.0
2011-05-26 00:00:00  2011-07-23  normal  reading_arts      2      30         0.0
2011-05-26 00:00:00  2011-07-23  normal  reading_arts      5      75         0.0
2011-05-26 00:00:00  2011-07-22  normal  reading_arts      1      13         0.0
2011-05-27 15:39:28  2011-07-23  normal       hickies     16     208       -10.4
2011-06-01 00:00:00  2011-07-23  normal  reading_arts      2      30         0.0
2011-06-02 00:00:00  2011-07-23  normal  reading_arts     17     221         0.0

..我创建的:

data = read_csv('2011.csv', 
                names=('event', 'user', 'count', 'amount', 'commission'), 
                parse_dates=True)

“事件”虽然看起来像日期,但实际上只是特定事件的标识符。

您会注意到 DateTimeIndex 中有重复的条目,例如:2011-05-23 00:00:00。

我最终想要的是每个事件的每个用户的一组 3 个时间序列(针对每个计数、金额和佣金),通过求和将其下采样到每周的存储桶。我还想为每个事件创建类似的时间序列,这只是每个用户每个事件时间序列的总和。

我该怎么做?

最佳答案

编辑 - 尝试以下代码:

注意 - 我获取了 csv 并为每一行添加了标题。我添加的第 1 行列标题是:

time    event   name    user    count   amount  commission

尝试运行此程序,如果它仍然不是您正在寻找的内容,请告诉我。

import pandas as pd
import numpy as np

df= pd.DataFrame.from_csv('sample.csv')

resamp = df.groupby(['event','user']).resample('W', how='sum')

关于python - 使用 pandas 从标准化 csv 中提取下采样时间序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24657661/

相关文章:

python - 比较两个列表以找到更大的列表

python - 当 n 可能为零时如何切片(在 Python 中) "all but the last n"项?

python - 如何仅将行从一个数据帧移动到第二个数据帧中不存在 ID 的另一个数据帧?

python - Pandas :如何在导出到 Excel 后格式化单元格

python - 从系列中删除分钟和小时

python - 使用 Ajax 的 flask

python - Sklearn Pipeline - 如何在自定义 Transformer(不是 Estimator)中继承 get_params

python - 如何计算两列之间的模糊比?

python - 通过SSH连接到MySQL数据库

Python Pandas 对齐单元格中的文本