我知道要计算列的每个唯一值并将其转换为百分比,我可以使用:
df['name_of_the_column'].value_counts(normalize=True)*100
我想知道如何将所有列作为函数执行此操作,然后删除给定列中唯一值占所有值 95% 以上的列?请注意,该函数还应该计算 NaN 值。
最佳答案
你可以试试这个:
l=df.columns
for i in l:
res=df[i].value_counts(normalize=True)*100
if res.iloc[0]>=95:
del df[i]
关于python - 查找 Pandas 中每列的每个唯一值的百分比,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64667248/