我的 CSV 文件看起来像这样
location StartDate EndDate
Austin 10/24/20. 10/31/20
Austin 11/28/20. 12/05/20
Austin 12/26/20. 01/02/21
Austin 10/10/20 10/17/20
Austin 10/03/20. 10/10/20
Kansas 10/24/20. 10/31/20
Kansas 11/28/20. 12/05/20
Kansas 12/26/20. 01/02/21
Kansas 10/03/20. 10/10/20
Tampa 10/24/20. 10/31/20
Tampa 11/28/20. 12/05/20
Tampa 10/03/20. 10/10/20
如您所见,堪萨斯州缺少 10/10/20 - 10/17/20,坦帕缺少 10/10 和 12/26 的 2 条记录。有没有办法使用 Pandas 和 python 从文件中找到丢失的记录?
最佳答案
让我们尝试pivot
和unstack
:
(df.pivot(*df)
.stack(dropna=False)
.loc[lambda x: x.isna()]
)
输出:
location StartDate
Kansas 2020-10-10 NaT
Tampa 2020-10-10 NaT
2020-12-26 NaT
dtype: datetime64[ns]
关于python - 如何使用 Pandas 在 csv 中查找缺失的行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64124593/