Python正则表达式找到确切的单词

标签 python regex

我想从我的单词中删除某些特殊字符和一些垃圾,如“"”(但我想保留一些特殊字符,如“é”、“á”等)。如何匹配精确模式“"”(或“quot”,因为我可以单独删除“&”)?

word = re.sub('[,|;|?|!|(|)|{|}|.|&|\bquot\b]+', '', word)

我正在尝试这个,但它删除了所有 'q''u''o''t' 字符。

编辑 按要求测试字符串:

'&quottermészet&quot' should be 'természet'    
'data,' should be 'data'

最佳答案

在方括号内时,不需要 | 分隔符

尝试使用这个正则表达式

re.sub(r'[,;?!(){}.]|\&quot', '', word)

关于Python正则表达式找到确切的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42140784/

相关文章:

python - 调用 re.compile 时什么属性返回正则表达式?

Python:UnboundLocalError:赋值前引用的局部变量 'count'

python - 使用 Airflow UI 执行整个 DAG

Python - 正则表达式仅保留带有文本字符的单词

python - ManyToOneRel 和 ForeignKey 的区别?

python - 基于文本的角色扮演游戏 : How to apply cool downs to user input

javascript - 正则表达式替换为捕获的

regex - 使用 sed 提取 git diff 的插入和删除次数

python - 在Python中使用正则表达式从文件名中获取剧集编号

python - 带有 python requests 模块的多行正则表达式