我想用 ':' 和 ' ' 字符拆分字符串。但是,我想忽略两个空格“”和两个冒号“::”。例如
text = "s:11011 i:11010 ::110011 :110010 d:11000"
应该分成
[s,11011,i,11010,:,110011, ,110010,d,11000]
在遵循 python 网站上的 Regular Expressions HOWTO 之后,我设法想出了以下内容
regx= re.compile('([\s:]|[^\s\s]|[^::])')
regx.split(text)
然而,这并没有像预期的那样工作,因为它在 : 和空格上进行了拆分,但它仍然在拆分中包含了 ':' 和 ' '。
[s,:,11011, ,i,:,11010, ,:,:,110011, , :,110010, ,d,:,11000]
我该如何解决这个问题?
编辑:在双空格的情况下,我只希望出现一个空格
最佳答案
请注意,这假设您的数据具有类似 X:101010
的格式:
>>> re.findall(r'(.+?):(.+?)\b ?',text)
[('s', '11011'), ('i', '11010'), (':', '110011'), (' ', '110010'), ('d', '11000')]
然后链接
它们:
>>> list(itertools.chain(*_))
['s', '11011', 'i', '11010', ':', '110011', ' ', '110010', 'd', '11000']
关于Python 使用正则表达式拆分字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16330838/