python - 如何从不同的群体中获得相似的分布?

标签 python pandas statistics data-science

我必须在数据集中找到两个指标的平均值与原始组相似的子组。

例如,我想查找平均值(metric 1) = 10平均值(metric 2) = 5最接近的一个城市或一组城市。

数据集示例:

enter image description here

我该怎么做?

最佳答案

只需按城市分组,然后按收盘值排序(我刚刚添加了两个指标列,希望没问题,因为我不知道指标是什么)

df2 = df.groupby(['city']).mean()

input1 = 10
input2 = 5

df_sort = df2.iloc[((df2['metric 1']-input1)+(df2['metric 2']-input2)).abs().argsort()]

关于python - 如何从不同的群体中获得相似的分布?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54767195/

相关文章:

python - 根据条件将多列上的值替换为 nan

r - 将 stat_compare_means 与 r : calculates p value only for 1 facet 中的构面结合起来

Python 不解释已更改的文件,使用过时的 .pyc

python - Map减少存储 'Nan',同时计数大对象

python - 如何获取表中出现频率最高的行

python - 如何从经验分布函数中抽样

algorithm - 如何生成满足泊松分布的随机数

python - 当我在odoo中选择复选框时如何动态生成新字段?

python - 如何在Pandas DataFrame中随机更改某些行的值?

python - 使用 pandas/numpy 进行高效的 p​​ython 数据转换