regex - Pandas 正则表达式按字符和组进行拆分

标签 regex pandas split regex-group

到目前为止,我从未抽出时间学习正则表达式,但我正在尝试弄清楚如何在 pandas 中使用它与 Series.str.match(expression) 来拆分一个列以创建两个新列。 (我知道我可以在没有正则表达式的情况下做到这一点)

列数据的示例是:

True Grit {'Rooster Cogburn'}

The King's Speech {'King George VI'}

Biutiful {'Uxbal'}

两个分组中的每个分组中可以有大于 1 的任意数量的字符串。如何提取两个组来生成 True Grit, Rooster Cogburn

最佳答案

鉴于此数据框

    col
0   True Grit {Rooster Cogburn}
1   The King's Speech {King George VI}
2   Biutiful {Uxbal}

df = df.col.str.extract('(.*)\s*{(.*)}', expand = True)

将返回

    0                   1
0   True Grit           Rooster Cogburn
1   The King's Speech   King George VI
2   Biutiful            Uxbal

关于regex - Pandas 正则表达式按字符和组进行拆分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44166050/

相关文章:

javascript - 将括号中带有索引的字符串转换为 JSON 数组

javascript - 使用 javascript 获取字符串拆分后的剩余部分

bash - 如何在 bash shell 中将一个字符串拆分为至少由一个空格分隔的多个字符串?

正则表达式匹配重复的行首字符串并删除重复项

php - Cisco 在 php 脚本中显示 dmvpn 正则表达式更改正则表达式

javascript - 关于正则表达式匹配js模板的问题

sql - 用正则表达式解析WHERE条件

python - 如果索引相同,则合并同一数据框中的两行?

Python Pandas - 比较 2 个数据帧,多个参数

python - 对数据框中的一组选定行执行数学运算的最有效方法是什么