python-3.x - 在合并时应用函数

标签 python-3.x pandas merge min concatenation

我有两个数据框。片段粘贴在下面

员工

enter image description here

项目

enter image description here

两个数据框都有公共(public)列“级别”和“技能”,我需要将员工数据框的“EmployeeID”列合并到项目数据框。但问题是我需要将那些 EmployeeID 添加到 CostToCompany 最低的项目中。我怎样才能做到这一点?

enter image description here

最佳答案

您可以drop_duplicates选择成本最低的一个

Employee=Employee.sort_values(['Level','skill','CostToCompany']).drop_duplicates(['Level','skill','Rating'],keep='first')

那么,

Project1=pd.merge(Project,Employee['Level','skill','Employee ID'].on='cols')

或者您可以使用您的结果执行以下操作:

Project1.sort_values(['Level','skill','CostToCompany']).drop_duplicates(['Level','skill','Rating'],keep='first')

关于python-3.x - 在合并时应用函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47022363/

相关文章:

map - 尝试在 Go 中实现 map 合并功能但失败

git - stash 时 merge 状态丢失

python-3.x - 使用 matplotlib 自动为散点图指定颜色?

python - 不同流程之间共享值的问题

python - Pandas 字符串按可变长度位置过滤

python - 使用 Pandas 导入时,如何跳过 .txt 文件中值多于/少于 6 的行

python - 如何打印元组中的项目?

python - 在单个特征数据框中查找质心和点之间的距离 - KMeans

python - 如何在 python 中按模式分组?

git - 将 SVN 存储库主干链接为 Git 存储库子文件夹的分支