我似乎无法找到我正在寻找的问题/答案,这可能是我没有正确提出问题。任何帮助将不胜感激。
我有一个 pandas 数据框,我只想获得其中一种组合,我不关心顺序:
ind col0
1 [11908513152, 11646250552]
2 [11885390452, 15535908250]
3 [11505181152, 16840777350]
4 [10939963252, 21451188650]
5 [11794522952, 71374807803]
6 [11545148452, 19354003650]
7 [11849104552, 12114525052]
8 [15535681750, 11832504652]
9 [13120602349, 11281922352, 17273945153]
10 [11281922352, 17273945153, 13120602349]
11 [11646250552, 11908513152]
...
第 10 行与第 9 行的值相同,我只想要其中一个。第 1 行和第 11 行相同。
最佳答案
我会做什么 split
+ explode
然后使用 duplicated
s=df.col0
yourdf=df[df.index.isin(s.str.split(', ').explode().duplicated().loc[lambda x : ~x].index)]
xxxxx
0 11908513152, 11646250552
1 11885390452, 15535908250
2 11505181152, 16840777350
3 10939963252, 21451188650
4 11794522952, 71374807803
5 11545148452, 19354003650
6 11849104552, 12114525052
7 15535681750, 11832504652
8 13120602349, 11281922352, 17273945153
关于python - 如何过滤掉 Pandas 数据框列中的一种组合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59395748/