我有一个 pandas DataFrame,我想获取它的基本统计信息,例如唯一值的数量、每个值出现的次数。类似于 df.describe
.
我的问题是某些列有列表,我收到此错误:
>>> df["col_a"].nunique()
TypeError: unhashable type: 'list'
我的专栏如下所示:
col_a:
["a","b"]
["b","a"]
["c"]
["a","b","c"]
[]
NaN
处理此问题的最简单方法是什么?
最佳答案
转换为可散列的元组:
df['col_a'] = df['col_a'].dropna().apply(tuple)
输出:
col_a
0 (a, b)
1 (b, a)
2 (c,)
3 (a, b, c)
4 ()
5 NaN
您现在可以执行此操作(返回5
):
df['col_a'].nunique()
关于python - 如何获得一系列列表的基本统计数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41483330/