pandas - 我希望数据框中存在的客户的虚假值(value)多于真实值(value)。有关如何实现这一目标的任何建议

数据框:

df = pd.DataFrame({'A': ['cust1', 'cust1', 'cust2', 'cust1',
                            'cust2', 'cust1', 'cust2', 'cust2','cust2','cust1'],
                       'B': ['true', 'true', 'true', 'false',
                            'false', 'false', 'false', 'true','false','true']})

输出:['cust2']

最佳答案

首先获取 crosstab 的计数然后使用 boolean indexing 按列过滤 index 值，更大则使用 Series.gt :

df1 = pd.crosstab(df['A'], df['B'])
print (df1)
B      false  true
A                 
cust1      2     3
cust2      3     2

c = df1.index[df1['false'].gt(df1['true'])].tolist()
#if True, False are boolean
#c = df1.index[df1[False].gt(df1[True])].tolist()
print (c)
['cust2']]

关于pandas - 我希望数据框中存在的客户的虚假值(value)多于真实值(value)。有关如何实现这一目标的任何建议，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60881404/

上一篇：c - 忽略 C 中的输出参数

下一篇：amazon-web-services - ELB健康检查失败

相关文章：

c# - 将项目添加到 Visual Studio 解决方案时出现的问题

python - 使用规范化展平三重嵌套 JSON

c# - 如何使用回溯算法获得所有可能的解决方案？

python - 在 Excel 中删除 Pandas 条件格式

python - Pandas 使用 numpy 数组填充值

python - pandas 数据框中均值的定义是什么？

python - 将 pandas 列值附加为新列

msbuild - 在MSBuild中解析VisualStudioVersion时，Visual Studio 2013解决方案格式版本不正确

python - 如何在不使用 Python 分配列名的情况下读取此 ASCII 数据？

Python Regex 将评论拆分为数据框