我有下表,其中包含虚构数据:
我想删除所有重复的行,并仅保留“赢得营业额”中包含正值的行。因此,在这种情况下,应删除标有红色的两行
此外,如果存在仅丢失营业额的重复行,则应保留营业额最高的行(底部两行)。
最佳答案
也许这可以做到:
df.sort_values(['Won Turnover', 'Lost Turnover'], ascending=False).drop_duplicates('Supplier')
关于Python:根据另一个列值从DataFrame中删除重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58265366/