python - 是否有一种有效的方法来过滤并将函数应用于该数据集?

标签 python pandas

我有一个包含出发地、目的地和成本列的数据集。有 x 个出发地和 y 个目的地。每个起点都映射到 y 个目的地,并具有相应的成本。

我的目标是创建一个新列,显示在给定预算金额的情况下从每个出发点可以到达的目的地数量。我可以轻松地单独对每个来源执行此操作,但这需要永远遍历 x 个不同的来源。

有没有办法过滤这个巨大的数据集,定义一个函数来得出每个起点的目的地的正确结果?

最佳答案

我对这个问题的理解是,您想要使用给定的行程预算每个出发地可到达的地点数量。因此,有点像使用相同价格可以到达的其他目的地的数量。

我们可以通过按来源对数据进行分组,然后对预算进行排名来做到这一点 - 使用 method = 'max' 我们在平局期间获取最高排名:

x.groupby('OriginID').apply(lambda x: x.Budget.rank(method = 'max'))

关于python - 是否有一种有效的方法来过滤并将函数应用于该数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49497671/

相关文章:

python - 使用 ctypes 从 numba 调用 fortran

python - 使用 psycopg2 库复制命令

python - 根据 pandas 数据框中的条件,使用不同标记在 basemap 上绘制点

Python:如何计算两个IP地址和端口之间接收和发送的数据

python - 添加一个列(EMA),这是 pandas 中先前新列值的结果

python - 尽管是分开的,但在更改另一个数组时意外更改了一个 numpy 数组

python - 从 html 中获取内容并将获取的内容以特定格式写入 CSV

python - 匹配字符串时对 pandas 中的行进行条件计数

python - 多索引 Pandas DataFrame 中的顺序排序

python - 基于两列值从 pandas 数据框中有效提取信息