我的数据集中有一列表示以毫秒为单位的日期,有时它的值为 nan
(实际上我的列是 str
类型,有时它的值为 'nan'
)。我想计算本专栏的天数。问题是,在做两个日期的差异时:
(pd.to_datetime('now') - pd.to_datetime(np.nan)).days
如果是
nan
它被转换为 NaT
区别在于类型 NaTType
没有属性 days
.就我而言,我想要
nan
其结果。我尝试过的其他方法:
np.datetime64
不能使用,因为它不能作为参数 nan
.我的数据无法转换为 int
自 int
没有 nan
.
最佳答案
即使您先过滤它也会起作用:
In [201]:
df = pd.DataFrame({'date':[dt.datetime.now(), pd.NaT, dt.datetime(2015,1,1)]})
df
Out[201]:
date
0 2015-08-28 12:12:12.851729
1 NaT
2 2015-01-01 00:00:00.000000
In [203]:
df.loc[df['date'].notnull(), 'days'] = (pd.to_datetime('now') - df['date']).dt.days
df
Out[203]:
date days
0 2015-08-28 12:12:12.851729 -1
1 NaT NaN
2 2015-01-01 00:00:00.000000 239
关于pandas - 'NaTType' 对象没有属性 'days',我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32269676/