python - 有条件删除重复项

标签 python pandas

我有以下 pandas 数据框:

<表类=“s-表”> <标题> 索引 so_id <正文> 10 390 10 395 10 405 11 390 11 395 11 405 12 390 12 395 12 405

所需的输出如下:

<表类=“s-表”> <标题> 索引 so_id <正文> 10 390 11 395 12 405

基本上,我的目标是删除“index”列上的重复项,同时为“so_id”列保留不同的升序值

最佳答案

我们可以做到,但重要的是,请注意上面的评论。

df=df.sort_values (by=['so_id'])#Sort df

创建临时列t,它是so_idresort的分类df回到原来的 df=df.assign(t=df['so_id'].ne(df['so_id'].shift(1)).cumsum()).sort_values(by='index')

创建索引的临时分类

df=df.assign(t1=df['index'].ne(df['index'].shift(1)).cumsum())

选择上面两个类的相似之处

df=df[df['t']==df['t1']].drop(columns=['t','t1'])

print(df)

    index  so_id
0     10    390
4     11    395
8     12    405

关于python - 有条件删除重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66959215/

相关文章:

python - 将字符串中的随机字符转换为大写

python - 使用 QuantLib 计算 FloatingRateBond 的现金流量

python - 具有零值的 Pandas 堆积面积图

python-3.x - 如何检查嵌套列表是否存在以及如果存在则取消嵌套?

python - python 连接不同类型数据的最佳实践有哪些?

java - 有人可以解释一下这段代码中如何使用移位吗?

python - 结合 Sympy 和不确定性

python - 将字典列表的字典转换为 Pandas 数据框

python - 散点图 x 轴刻度标签未显示

python - Pandas:是否有一种惯用的方法来为一组列中的每个值创建行?