我想从我的单词中删除某些特殊字符和一些垃圾,如“"”(但我想保留一些特殊字符,如“é”、“á”等)。如何匹配精确模式“"”(或“quot”,因为我可以单独删除“&”)?
word = re.sub('[,|;|?|!|(|)|{|}|.|&|\bquot\b]+', '', word)
我正在尝试这个,但它删除了所有 'q''u''o''t' 字符。
编辑 按要求测试字符串:
'"természet"' should be 'természet'
'data,' should be 'data'
最佳答案
在方括号内时,不需要 | 分隔符
尝试使用这个正则表达式
re.sub(r'[,;?!(){}.]|\"', '', word)
关于Python正则表达式找到确切的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42140784/