python - 如何过滤掉 Pandas 数据框列中的一种组合

标签 python pandas

我似乎无法找到我正在寻找的问题/答案,这可能是我没有正确提出问题。任何帮助将不胜感激。

我有一个 pandas 数据框,我只想获得其中一种组合,我不关心顺序:

   ind   col0   
    1    [11908513152, 11646250552]    
    2    [11885390452, 15535908250]    
    3    [11505181152, 16840777350]   
    4    [10939963252, 21451188650]   
    5    [11794522952, 71374807803]  
    6    [11545148452, 19354003650]  
    7    [11849104552, 12114525052]  
    8    [15535681750, 11832504652]    
    9    [13120602349, 11281922352, 17273945153]   
    10   [11281922352, 17273945153, 13120602349]   
    11   [11646250552, 11908513152]    
    ... 

第 10 行与第 9 行的值相同,我只想要其中一个。第 1 行和第 11 行相同。

最佳答案

我会做什么 split + explode 然后使用 duplicated

s=df.col0
yourdf=df[df.index.isin(s.str.split(', ').explode().duplicated().loc[lambda x : ~x].index)]
                                     xxxxx
0               11908513152, 11646250552  
1               11885390452, 15535908250  
2               11505181152, 16840777350  
3               10939963252, 21451188650  
4               11794522952, 71374807803  
5               11545148452, 19354003650  
6               11849104552, 12114525052  
7               15535681750, 11832504652  
8  13120602349, 11281922352, 17273945153  

关于python - 如何过滤掉 Pandas 数据框列中的一种组合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59395748/

相关文章:

python - 类型错误 : 'dict' object is not callable from main

python - 将 Flask-Assets 与 Flask-Mako 结合使用

python - ipython,从 bash 到变量

python - 如何使用 Python/Pandas 从日期字段按月、日分组

python - 这些 for 循环可以重构吗?

Python,在列中拆分多个字符串

python - 如何在球面上绘制具有方位角和仰角的热图以及每个位置的相应值

Python Numpy : All combinations from array or scalar

python - 两个 Pandas 数据帧的相关矩阵

python-3.x - 具有重复名称的 Pandas read_table