我有一个数据库,例如。
Name Subset
Apple -AI-,-BI-A,-XC-,ZX-
Bat -po-,-IJ-,-IA-B
并想将其转换为:
Name Subset
Apple AI,BI,XC,ZX
Bat po,IJ,IA
即删除第一个连字符并删除第二个连字符和后面的字符,直到出现下一个逗号。
最佳答案
使用Series.str.split
、Series.explode
和Series.groupby.agg
:
In [2193]: df['Subset'] = df.Subset.str.split(',').explode().str.split('-').str[:2].apply(''.join).groupby(level=0).agg(','.join)
In [2194]: df
Out[2194]:
Name Subset
0 Apple AI,BI,XC,ZX
1 Bat po,IJ,IA
关于python - 仅保留具有逗号分隔列表的数据框单元格中两个连字符之间的字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71409935/