我有一个包含很多列的表,我想删除缺失值超过 500 的列。
我已经知道每列缺失值的数量:
library(fields)
t(stats(mm))
我有 :
N mean Std.Dev. min Q1 median Q3 max missing values
V1 1600 8.67 … 400
一些列的所有特征都显示为 NA :
N mean Std.Dev. min Q1 median Q3 max missing values
V50 NA NA NA NA NA NA
我也想删除这些类型的列。
最佳答案
这是一个单衬做它mm[colSums(is.na(mm)) > 500]
关于删除缺失值的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7330915/