我有一个 200,000 x 500 dataframe
加载到 Pandas 中。是否有一个函数可以自动告诉我哪些列缺少数据?或者我是否必须遍历每一列并逐个元素检查?
一旦找到丢失的元素,我如何定义自定义函数(基于列名和同一行中的其他一些数据)来进行自动替换。我看到了 fillna() 方法,但我认为它不需要 (lambda) 函数作为输入。
谢谢!
最佳答案
就像是:
import pandas as pd
pd.isnull(frame).any()
可能是您寻找丢失数据的方法
fillna 目前不接受 lambda 函数,尽管它在 github 上作为一个 Unresolved 问题在工作中。
您现在可以使用 DataFrame.apply 进行自定义填充。但是,您能否更具体地说明填充数据所需的操作?只是好奇用例是什么。
关于pandas - 处理 Pandas 中的缺失数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11620721/