我是正则表达式的新手,我正在尝试编写一个函数来将字符串分解为缩写和标点符号。
例如:我今天感到难过。
应返回一个列表:["I","'m","feeling","sad","today","."]
。
到目前为止,我只能使用 ([a-zA-Z])\w*
过滤字母,并且我不确定如何过滤它以包含标点符号。
最佳答案
import re
st = "I'm feeling sad today."
li = re.findall(r'\w+|[;.,!?:]|\'\w+',st)
['I', "'m", 'feeling', 'sad', 'today', '.']
关于python - 正则表达式-捕获标点符号和缩写,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33464240/