python - 正则表达式-捕获标点符号和缩写

标签 python regex punctuation

我是正则表达式的新手,我正在尝试编写一个函数来将字符串分解为缩写和标点符号。

例如:我今天感到难过。

应返回一个列表:["I","'m","feeling","sad","today","."]

到目前为止,我只能使用 ([a-zA-Z])\w* 过滤字母,并且我不确定如何过滤它以包含标点符号。

最佳答案

import re

st = "I'm feeling sad today."

li = re.findall(r'\w+|[;.,!?:]|\'\w+',st)

['I', "'m", 'feeling', 'sad', 'today', '.']

关于python - 正则表达式-捕获标点符号和缩写,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33464240/

相关文章:

python - 为什么 2 个不同的 python lambda 具有相同的字节码?

python - AWS DynamoDB 检索整个表

python - 将文件复制到现有目录会导致 IOError [错误 21] 是一个目录

python - 如何在 python 中查看 Heroku 日志记录和运行时错误输出

Javascript:奇怪的正则表达式行为

regex - 正则表达式精确匹配不带参数的 URL 的最后一个路径段,除非路径以尾部斜杠结尾

python - 如何在Python中不使用正则表达式的情况下查找并摆脱连续重复的标点符号?

regex - 将 NR 的值传递给 AWK 中的变量

android - runOnUiThread(new Runnable() { 标点符号(token)问题

python - 如何从字符串中删除所有标点符号?