python - 如何在 python pandas 中查找特定列的唯一值计数?

标签 python python-2.7 pandas dataframe

我有以下数据框。,

company,sector,marks
a,b1,21
b,b2,27
c,b2,20
a,b3,70

我必须显示公司编号、部门和分数总和 我们如何在 pandas 中获取唯一的列值长度

最佳答案

我认为你可以使用nuniquesum :

print (pd.Series([df.company.nunique(),
                  df.sector.nunique(),
                  df.marks.sum()], index=df.columns))


company      3
sector       3
marks      138
dtype: int64

print (pd.Series([df.company.nunique(),
                  df.sector.nunique(),
                  df.marks.sum()], index=df.columns).to_dict())
{'company': 3, 'sector': 3, 'marks': 138}

或者:

print (pd.Series([df.company.nunique(),
                  df.sector.nunique(),
                  df.marks.sum()], index=df.columns).to_json())
{"company":3,"sector":3,"marks":138}

如果需要自定义名称:

print (pd.Series([df.company.nunique(),
                  df.sector.nunique(),
                  df.marks.sum()], index=['comp','sec','mar']))

comp      3
sec       3
mar     138
dtype: int64

关于python - 如何在 python pandas 中查找特定列的唯一值计数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37857531/

相关文章:

python-2.7 - Aws Boto3 客户端(低级)与资源(高级)

python - 在 pandas 数据帧 : correlate() got an unexpected keyword argument 'old behavior' 中使用最大似然估计器的自动回归 (AR) 模型

python - Pandas:基于DataFrame中的其他列在DataFrame中创建新列

python - 为什么 += 运算符的工作方式不同于 + 并为 python 字典分配运算符?

python-2.7 - 如何使用 pandas 计算时间序列的扩展平均值?

python - 如何从 Jupyter 笔记本中删除 emacs 键绑定(bind)?

python - 返回列表中最长单词的 len

python - 向量化或加速 PANDAS 列上的 Fuzzywuzzy 字符串匹配

python - 负采样中排除正样本

python - 将 Yocto 与默认使用 python3 的发行版一起使用