有人知道如何计算数据透视表中的所有 bool 值(包括错误值)吗?
passed_exam
是一列 bool 值。
此代码仅针对真实值执行任务,这很棒:
table = pd.pivot_table(df,index=["student","semester"], values=["passed_exam"],aggfunc=np.sum)
但我还想要一个计算所有 bool 值的列。
提前谢谢您!
最佳答案
我认为你需要groupby
与 size
,最后一次 reshape unstack
:
df = pd.DataFrame({'student':['a'] * 4 + ['b'] * 6,
'semester':[1,1,2,2,1,1,2,2,2,2],
'passed_exam':[True, False] * 5})
print (df)
passed_exam semester student
0 True 1 a
1 False 1 a
2 True 2 a
3 False 2 a
4 True 1 b
5 False 1 b
6 True 2 b
7 False 2 b
8 True 2 b
9 False 2 b
table = df.groupby(["student","semester","passed_exam"])
.size()
.unstack(fill_value=0)
.rename_axis(None, axis=1)
.reset_index()
print (table)
student semester False True
0 a 1 1 1
1 a 2 1 1
2 b 1 1 1
3 b 2 2 2
关于Python 计算数据透视表中的所有 bool 值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42693958/