Python:将数据转换为时间序列

我的数据框中有一些数据(交易数据)，我需要每天进行总结。

数据连接到流，因此我有很多行，其中包含以下对此很重要的数据点(还有更多数据点，因此不在此处复制)

数量、开始日期、结束日期

例如:

Volume, Start Date, End Date   
100, 1 April 2019, 30 June 2019   
50, 1 Jan 2019, 30 June 2019

所有这些行的开始日期和结束日期都可以重叠。

我正在寻找一种创建输出的简单方法:(使用上面的 2 笔交易作为示例数据) 天，总交易量

例如:

1 Jan, 50  
2 Jan, 50  
....  
1 April, 150  
2 April, 150  
...  
29 June, 150  
30 June, 150  
1 July, 0   
...  
31 Dec, 0

我可以遍历每一行，然后遍历每笔交易。但对于这么多人来说，这似乎是一个漫长而缓慢的过程。

我正在使用 Jupyter 笔记本和 Python 3。

感谢任何帮助 - 即使它为我指明了我在搜索中可能错过的解决方案......

最佳答案

我已经通过过滤解决了这个问题。

def volumebyday(date, df, start, end, col):
#date = date to sum, df = dataframe, start/end = name of start/end date column, col = column to sum
    trade1 = df[start] <= date
    trade2 = df[end] >= date
    return df[col][trade1 & trade2].sum(axis=0)

然后通过 lambda 函数使用它

df = df.apply(lambda row: volumebyday(row["date"], trades, "start_date","end_date","qty")

关于Python:将数据转换为时间序列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56292797/

上一篇：python - 如何对分类列和数值列进行分组，并基于该组对数值进行分箱

下一篇：python - 如何防止 wx 面板与其他 sizer 重叠

相关文章：

Python代码-返回带元音的字符串中的第一个单词

Python 将每月值插入每日值(线性): Pandas

python - Pb 在时间序列索引上进行行选择

Pandas 将每小时时间序列重新采样为每小时比例时间序列

python - 一行Python中的多个整数输入

python - Bokeh 图访问单选按钮在 slider 回调中处于事件状态

python - formview odoo 10 中按钮中的名称 ="135"是什么意思

python - Xpath vs DOM vs BeautifulSoup vs lxml vs other 解析网页的最快方法是什么？

python - 使用 pandas 将 csv 文件中的数据读入时间序列

r - 按周计算每日观察次数