我必须在数据集中找到两个指标的平均值与原始组相似的子组。
例如,我想查找平均值(metric 1) = 10
和平均值(metric 2) = 5
最接近的一个城市或一组城市。
数据集示例:
我该怎么做?
最佳答案
只需按城市分组,然后按收盘值排序(我刚刚添加了两个指标列,希望没问题,因为我不知道指标是什么)
df2 = df.groupby(['city']).mean()
input1 = 10
input2 = 5
df_sort = df2.iloc[((df2['metric 1']-input1)+(df2['metric 2']-input2)).abs().argsort()]
关于python - 如何从不同的群体中获得相似的分布?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54767195/