我想断言一个字符串包含两个相同的子字符串。
我试过这个正则表达式:[A-ZA-Z]{2}
我想检测什么:
AZAZ
CUCU
PIPI
但是这个正则表达式只是检查连续是否有 4 个大写字母,所以
ABCD --> it's good and it shouldn't be
如果不清楚,我真的很抱歉,我不知道如何编写正则表达式来断言重复。
最佳答案
使用 Python,您可以执行以下操作:
p="((?P<two_chars>[A-Z]{2})(?P=two_chars))"
s="AZAZABCDCUCUPIPI"
re.findall(p, s)
[('AZAZ', 'AZ'), ('CUCU', 'CU'), ('PIPI', 'PI')]
然后从列表中提取您想要的元素。或者您可以更快地执行以下操作:
[k for k,v in re.findall(p,s)]
['AZAZ', 'CUCU', 'PIPI']
希望能帮助到你。
关于regex - 如何在正则表达式模式中定义循环?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19154801/