python - .count 和 .sum 之间的 pandas dataframe 令人困惑的区别

标签 python pandas

在下面的数据框中,adam 两次通过电子邮件联系,一次通过电话联系。如果我使用 sum() 来计算电子邮件的总使用量,我会得到正确的结果:2。 但是如果我使用 count(),adam 得到 3。 为什么会这样? .count() 不区分 True 和 False bool 值吗?

df = pd.DataFrame ({'Name':['adam','ben','adam','adam','ben'], 'Type' ['Email', 'Phone', 'Email','Phone','Phone']}, index =[0,1,2,3,4])

df.groupby('Name')['Type'].apply(lambda x: x.isin(['Email']).sum())
df.groupby('Name')['Type'].apply(lambda x: x.isin(['Email']).count())

最佳答案

count 的技术定义方法是统计非缺失值。由于您的所有值都没有缺失,因此它只返回每个组的行数。

关于python - .count 和 .sum 之间的 pandas dataframe 令人困惑的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44875624/

相关文章:

python - 如何删除 Pandas 中包含特定字符串的任何行?

python - Pandas 数据框中等效的 SQL 查询

python - 如何使用 Flask 将帖子中的 url 替换为指向该 url 的链接?

python - Pytorch:从矩阵元素的总和反向传播到叶变量

python - 从 IP 字符串转换为整数,并在 Python 中向后转换

python - 调试与 EC2、Ubuntu 和 Django 断开的连接

python - 应用条件分组

jquery - 如何从 ajax POST 表单提交中使用 Flask 的 render_template

python - 您可以根据特征值在另一个数据框中出现的次数来复制 Pandas 数据框中的行吗?

pandas - 查找范围内的值以便合并或连接