我正在将 .xlsx 电子表格读取到 Pandas DataFrame 中,以便可以根据所有列删除重复行并将 DataFrame 导出到 .csv 中。其中一列是格式为 MM/DD/YY 的日期列。
Here is a sample of the unaltered data
此电子表格包含工资单的异常工资工时条目,该工资单每周五根据从前一周到本周的工时进行支付。每天都会添加行,当天的数据存在异常功能。我想告诉 pandas 仅在日期小于或等于当前星期五一周前的星期五日期的行中查找重复项(此脚本仅在星期五运行)。例如,如果今天是 12/7/18 星期五,我想设置上一个星期五 11/30/18 的截止日期,并且只查看日期在 11/30/18 或之前的行。在执行 drop_duplicates 之前如何以这种方式修剪 DataFrame?
最佳答案
您可以使用日期和时间增量。
获取今天的日期。 存储从今天开始一周的日期。 过滤您的数据(我不确定您如何存储它,但我使用通用名称)
from datetime import date, timedelta
today = date.today()
week_prior = today - timedelta(weeks=1)
df_last_week = df[df['date'] <= week_prior]
关于python - 按当前日期前一周的日期过滤数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53764511/