python - Excel不同格式的日期如何在Pandas数据框中排序

标签 python excel pandas

我有一组数据并希望使用 Pandas 进行分析,但问题是数据集中的日期格式不一致。即使我已经通过格式单元格更改了日期,但仍然有一些日期存储为文本。
data_set
我在 Python 中得到的东西:enter image description here

最佳答案

您可以使用 pd.to_datetime() errors='coerce'参数,如下:

# convert Date with different format strings
df['Date1'] = pd.to_datetime(df['Date'], format='%m/%d/%Y', errors='coerce')
df['Date2'] = pd.to_datetime(df['Date'], format='%m-%d-%y', errors='coerce')
将结果与 .combine_first() 合并:
df['Date_combined'] = df['Date1'].combine_first(df['Date2'])
然后,您可以按以下方式对日期进行排序:
df.sort_values(by='Date_combined')
演示
输入:
         Date
0  11/26/2013
1  11/26/2015
2   3/23/2014
3    08-02-13
4    08-02-15
5    09-02-13
6   1/22/2014
输出:
         Date      Date1      Date2 Date_combined
0  11/26/2013 2013-11-26        NaT    2013-11-26
1  11/26/2015 2015-11-26        NaT    2015-11-26
2   3/23/2014 2014-03-23        NaT    2014-03-23
3    08-02-13        NaT 2013-08-02    2013-08-02
4    08-02-15        NaT 2015-08-02    2015-08-02
5    09-02-13        NaT 2013-09-02    2013-09-02
6   1/22/2014 2014-01-22        NaT    2014-01-22

关于python - Excel不同格式的日期如何在Pandas数据框中排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68782700/

相关文章:

python - 模拟与魔术模拟

python manage.py runserver、shell、dbshel​​l 在 git-bash 上卡住

python - 没有为 Django 迁移创建模型表

python - 将按 df 分组转换为带有字典列表的字典

python - 在 pandas 中将一列连接到另一列的末尾后获取列的平均值

python - 如何让闪烁的字符串也改变值? ( python 3.5)

vba - Excel VBA 中的 for 循环

windows - 将图像名称及其大小保存到 Windows 中的文件中

r - 通过命令提示符 Shell 将 VBA 转换为 R

python - Pandas 使用其他 Dataframe 更新 Dataframe