Pandas 新手。想知道如何划分由多列分组的数据框?我想获得 var3 (在某些条件下)'var1' 和 'var2' 的比例。人们可以将此问题视为按每天和职业查找正常工作时间的工作时间百分比。 Var 3 是工作时间(以 df2 的正常工作时间为条件),按日期和职业分组
df = pd.DataFrame(data) ###all data, here all time
df2 = df[(df['hours'] > x)] ### subset, here all time during normal business hours
df = df.groupby(["var1", "var2"]).var3.sum()
df2 = df2.groupby(["var1", "var2"]).var3.sum()
normal_bus_hours_percent = (df2.div(df, level=['var1', 'var2']) * 100)
这失败了 TypeError:两个 MultiIndex 对象之间的级别连接不明确
即使你可以帮我合并这些数据框。我收到此错误: AttributeError:“系列”对象没有属性“列”
如果我尝试连接,我会收到此错误: 类型错误:第一个参数必须是类似 pandas 对象的列表,您传递了“Series”类型的对象
我来自 R,所以我习惯了简单的 cbind 或合并。
最佳答案
Pandas 默认按索引对齐,这不起作用吗?
normal_bus_hours_percent = (df2.div(df) * 100)
关于python - Pandas 除以多个列条目,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25394558/