假设我在数据帧 df 中有一个列 col1,如下所示,
col1 |
2018-01-30 00:00:00 |
Yes |
|
nan |
None |
我想要以下输出 col1 没有时间戳,同时保持其余内容完整,
col1 |
2018-01-30 |
Yes |
|
nan |
None |
我使用了以下代码行,
df['col2'] = pd.to_datetime(df['col1'], errors='coerce')
但似乎并没有解决上述问题。
我得到以下输出,
col1 |
2018-01-30|
NaT |
NaT |
NaT |
NaT |
我正在寻找 pandas 解决方案,但理想情况是寻找一个可以使用 python 重复使用的函数。非常感谢任何帮助!
最佳答案
一个想法是将日期时间转换为字符串替代方案,然后将缺失值替换为原始值:
df['col1'] = (pd.to_datetime(df['col1'], errors='coerce').dt.strftime('%Y-%m-%d')
.fillna(df['col1']))
或者将日期时间转换为Python日期:
df['col1'] = pd.to_datetime(df['col1'], errors='coerce').dt.date.fillna(df['col1'])
print (df)
col1
0 2018-01-30
1 Yes
2
3 NaN
4 None
关于python - 如何使用 pandas/python 从日期和字符串的列组合中删除时间戳?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65032674/