到目前为止,我从未抽出时间学习正则表达式,但我正在尝试弄清楚如何在 pandas 中使用它与 Series.str.match(expression)
来拆分一个列以创建两个新列。 (我知道我可以在没有正则表达式的情况下做到这一点)
列数据的示例是:
True Grit {'Rooster Cogburn'}
The King's Speech {'King George VI'}
Biutiful {'Uxbal'}
两个分组中的每个分组中可以有大于 1 的任意数量的字符串。如何提取两个组来生成 True Grit, Rooster Cogburn
?
最佳答案
鉴于此数据框
col
0 True Grit {Rooster Cogburn}
1 The King's Speech {King George VI}
2 Biutiful {Uxbal}
df = df.col.str.extract('(.*)\s*{(.*)}', expand = True)
将返回
0 1
0 True Grit Rooster Cogburn
1 The King's Speech King George VI
2 Biutiful Uxbal
关于regex - Pandas 正则表达式按字符和组进行拆分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44166050/