python - Pandas:删除带有某些日期的字符串

标签 python datetime pandas indexing dataframe

我有 df:

ID,"address","used_at","active_seconds","pageviews"
71ecd2aa165114e5ee292131f1167d8c,"auto.drom.ru",2014-05-17 10:58:59,166,2
71ecd2aa165114e5ee292131f1167d8c,"auto.drom.ru",2016-07-17 17:34:07,92,4
70150aba267f671045f147767251d169,"avito.ru/*/avtomobili",2014-06-15 11:52:09,837,40
bc779f542049bcabb9e68518a215814e,"auto.yandex.ru",2014-01-16 22:23:56,8,1
bc779f542049bcabb9e68518a215814e,"avito.ru/*/avtomobili",2014-01-18 14:38:33,313,5
bc779f542049bcabb9e68518a215814e,"avito.ru/*/avtomobili",2016-07-18 18:12:07,20,1

我需要删除 used_at 超过 2016-06-30 的所有字符串。我怎样才能做到这一点?

最佳答案

使用dt.dateboolean indexing :

print (df.used_at.dt.date > pd.to_datetime('2016-06-30').date())
0    False
1     True
2    False
3    False
4    False
5     True
Name: used_at, dtype: bool

print (df[df.used_at.dt.date > pd.to_datetime('2016-06-30').date()])
                                 ID                address  \
1  71ecd2aa165114e5ee292131f1167d8c           auto.drom.ru   
5  bc779f542049bcabb9e68518a215814e  avito.ru/*/avtomobili   

              used_at  active_seconds  pageviews  
1 2016-07-17 17:34:07              92          4  
5 2016-07-18 18:12:07              20          1  

或者您可以通过定义日期时间:

print (df[df.used_at.dt.date > pd.datetime(2016, 6, 30).date()])
                                 ID                address  \
1  71ecd2aa165114e5ee292131f1167d8c           auto.drom.ru   
5  bc779f542049bcabb9e68518a215814e  avito.ru/*/avtomobili   

              used_at  active_seconds  pageviews  
1 2016-07-17 17:34:07              92          4  
5 2016-07-18 18:12:07              20          1  

关于python - Pandas:删除带有某些日期的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38871775/

相关文章:

python - 如何在 for 循环内创建多个新数据框?

python - 我们可以在 python selenium webdriver 中缩放浏览器窗口吗?

python - win32gui.SetActiveWindow() 错误 : The specified procedure could not be found

python - 创建由符合条件的现有数据帧的特定行组成的新 pandas 数据帧的最佳方法是什么?

python - 展平 Pandas 数据透视表

Python:numpy.matrix.resize 移动元素

python - Pandas 数据帧KeyError : 'the label [2019-01-14] is not in the [index]'

python - 绘制数据框列 - 日期时间

php - 如何在 PHP 中将 time() 转换为 09/02/2010 的格式?

python - 将 Pandas 时间序列数据集合并到数值最近的索引、全外连接、聚合列到最大值