我想通过分组和聚合来计算每个 food_category 的 co2_emission 的方差和标准差。并且必须采用这种格式
print(food_consumption.____(____)['co2_emission'].agg([____]))
这是我到目前为止所做的
print(food_consumption. .....(....)['co2_emission'].agg([np.var(food_consumption['co2_emission'], ddof=1),np.sqrt(np.var(food_consumption['co2_emission'], ddof=1))]))
我必须选择名为 food_category 的列的每个类别。如何做到这一点?
最佳答案
因为 Pandas Series.var
和 Series.std
默认 ddof=1
将它们传递给 agg
:
print(food_consumption.groupby('food_category')['co2_emission'].agg(['var','std']))
关于python - 如何选择数据框中列的每个类别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71223167/