我想创建两个新列(每年),每个列都包含每个国家/地区和每年的“否”/"is"比率。有人可以帮忙吗?
Country Jobs 2017 2018
0 Spain Yes 3885 5331
1 Spain No 234 593
2 Portugal Yes 1231 2424
3 Portugal No 241 124
预期输出 -
Country Jobs 2017 2018 Ratio2017 Ratio2018
0 Spain Yes 3885 5331 0.06 0.11
1 Spain No 234 593
2 Portugal Yes 1231 2424 0.19 0.05
3 Portugal No 241 124
最佳答案
以下是计算您想要作为单独表格的比率的方法:
df_rearranged = df.set_index(['Country', 'Jobs']).unstack(level=0)
(df_rearranged.loc['No'] / df_rearranged.loc['Yes']).unstack().T
# 2017 2018
#Country
#Portugal 0.195776 0.051155
#Spain 0.060232 0.111236
需要一个简单的concat
或join
将其添加到原始表中。
关于python - 对数据 Pandas 进行操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52696762/