python - 如何使用 Pandas 在 csv 中查找缺失的行?

标签 python pandas numpy

我的 CSV 文件看起来像这样

location StartDate EndDate
Austin  10/24/20. 10/31/20
Austin  11/28/20. 12/05/20
Austin  12/26/20. 01/02/21
Austin  10/10/20  10/17/20
Austin  10/03/20. 10/10/20
Kansas  10/24/20. 10/31/20
Kansas  11/28/20. 12/05/20
Kansas  12/26/20. 01/02/21
Kansas  10/03/20. 10/10/20
Tampa   10/24/20. 10/31/20
Tampa   11/28/20. 12/05/20
Tampa   10/03/20. 10/10/20

如您所见,堪萨斯州缺少 10/10/20 - 10/17/20,坦帕缺少 10/10 和 12/26 的 2 条记录。有没有办法使用 Pandas 和 python 从文件中找到丢失的记录?

最佳答案

让我们尝试pivotunstack:

(df.pivot(*df)
   .stack(dropna=False)
      .loc[lambda x: x.isna()]
)

输出:

location  StartDate 
Kansas    2020-10-10   NaT
Tampa     2020-10-10   NaT
          2020-12-26   NaT
dtype: datetime64[ns]

关于python - 如何使用 Pandas 在 csv 中查找缺失的行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64124593/

相关文章:

python-3.x - Pandas 数据帧 : set_index with inplace=True returns a NoneType, 为什么?

python - 尝试从正则表达式生成 pandas 数据框列时出现问题?

python - 使用掩码移动知道新坐标的 3D 数组的值

python - SciPy 插值错误

python - 如何增加 `scipy.integrate.dblquad` 中函数的分割数?

python - Savefig as eps 产生不可使用的 eps

python - Matplotlib - x 轴与日期时间之间的间隔不均匀

python - 如何将 Python 列表格式化为已初始化的 C 数组?

python - BeautifulSoup XML 解析不起作用

python - Numpy isfinite type错误