pandas - 处理 Pandas 中的缺失数据

标签 pandas

我有一个 200,000 x 500 dataframe加载到 Pandas 中。是否有一个函数可以自动告诉我哪些列缺少数据?或者我是否必须遍历每一列并逐个元素检查?

一旦找到丢失的元素,我如何定义自定义函数(基于列名和同一行中的其他一些数据)来进行自动替换。我看到了 fillna() 方法,但我认为它不需要 (lambda) 函数作为输入。

谢谢!

最佳答案

就像是:

import pandas as pd
pd.isnull(frame).any()

可能是您寻找丢失数据的方法

fillna 目前不接受 lambda 函数,尽管它在 github 上作为一个 Unresolved 问题在工作中。

您现在可以使用 DataFrame.apply 进行自定义填充。但是,您能否更具体地说明填充数据所需的操作?只是好奇用例是什么。

关于pandas - 处理 Pandas 中的缺失数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11620721/

相关文章:

python - 如何在使用 pandas 读取 csv 文件时删除特定列?

arrays - 使用Python计算行是否包含这个和那个,然后制作结果的热图(?不确定这是否是正确的术语)

python - 在 Pandas 中将月份从数字重命名为名称

python - 将数据框 Pandas 的列更改为其中一列的值

pandas - 分类特征相关性

python - 如何检查数据框中是否有值

python - 通过/失败数据帧示例

python - 将锯齿状数组转换为 Pandas 数据框

python - 如何使用 python 中的最小内存使用量将数据框的子选择划分为另一个数据框?

python - Pandas - 如何提取 HH :MM from datetime column in Python?