我需要捕获11
、12-
-13
和14-15
等标记>
我希望拒绝任何包含上面未指定的无效标记的字符串,例如 12--
和 4-5-6
这些可以由任意数量的空格分隔,这些空格可能包含也可能不包含单个逗号。所以对于字符串:
43,5 67- -66,53-53 , 6
我想回来
('43', '5', '67-', '-66', '53-53', '6')
这是我试过的:
import re
num = r'\d{1,4}'
token = r'(?:-%s)|(?:%s-%s)|(?:%s-)|(?:%s)' % (num, num, num, num, num)
sep = r'\s*,?\s*'
valid = r'(%s)(?:%s(%s))*' % (token, sep, token)
test = re.compile(valid)
m = test.match("43,5 67- -66,53-53 , 6")
print(m.groups())
但它只打印第一个和最后一个数字:
('43', '6')
非常感谢任何帮助。
最佳答案
使用re.findall
:
>>> re.findall(r'[-\d]+', '43,5 67- -66,53-53 , 6')
['43', '5', '67-', '-66', '53-53', '6']
更新
使用否定环视断言来排除无效匹配。
>>> pattern = r'(?<![-\d])(\d+-\d+|-\d+|\d+-|\d+)(?![-\d])'
>>> re.findall(pattern, '43,5 67- -66,53-53 , 1--, 2, --3, -4-')
['43', '5', '67-', '-66', '53-53', '2']
关于Python 正则表达式捕获由空格和逗号分隔的数字和破折号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20687077/