我正在尝试使用 python 正则表达式拆分由方括号分隔的单词/短语。我想拆分输出。条件是以方括号开头和结尾的文本部分将拆分为不同的元素。
这是我目前所拥有的,但它不能正常工作:
import re
t="word1 word2 3456 [abc def] [ghi jkl] [1234] [-abcd] word 2345"
re.split("(\[)(.*)(\])+",t)
输出:
['word1 word2 3456 ',
'[',
'abc def] [ghi jkl] [1234] [-abcd',
']',
' word [xyz 2345']
我希望输出是这样的:
['word1 word2 3456 ',
'[abc def]',
' ',
'[ghi jkl]',
' ',
'[1234]',
' ',
'[-abcd]',
' word [xyz 2345']
请注意,只有带有左方括号和右方括号的项目才会被拆分。
我也试过这个:
re.split("(\[.*\])+",t)
但是那只会被第一个和最后一个方括号分开
['word1 word2 3456 ', '[abc def] [ghi jkl] [1234] [-abcd]', ' word [xyz 2345']
最佳答案
使用 .+?
代替 .*
:
>>> re.split("(\[.+?\])", t)
['word1 word2 3456 ', '[abc def]', ' ', '[ghi jkl]', ' ', '[1234]', ' ', '[-abcd]', ' word 2345']
关于python - 使用 python 正则表达式提取以方括号分隔的项目,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25649224/