我有一列网站:['Canada', 'USA', 'China' ....]
每个站点在 SITE 列中出现多次,每个实例旁边是一个真值或假值。
INDEX | VALUE | SITE
0 | True | Canada
1 | False | Canada
2 | True | USA
3 | True | USA
它还在继续。
目标 1:我想找出每个站点的 VALUE 列中有多少百分比为真。
目标 2:我想返回 VALUE 列中 % True 大于 10% 的网站列表。
如何使用 groupby 来实现这一点?我只知道如何使用 groupby 找到每个网站的平均值,这对我没有帮助。
最佳答案
像这样:
In [13]: g = df.groupby('SITE')['VALUE'].mean()
In [14]: g[g > 0.1]
Out[14]:
SITE
Canada 0.5
USA 1.0
关于python - Pandas groupby 查找真假百分比,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30311211/