python正则表达式，删除除撇号外的转义字符和标点符号

我有一个看起来像这样的字符串:

"aaa\n\t\n asd123asd water's tap413 water blooe's"

如何使用正则表达式删除撇号以外的所有转义字符、数字和标点符号？

我对正则表达式很陌生，如果你能解释每个表达式的含义，如果正则表达式公式很复杂，我将不胜感激

最佳答案

您正在寻找一种搜索和替换方法，在 Python 中应该是 re#sub()。

只需将非字母和撇号 ([^a-zA-Z' ]+) 替换为 ''(无)。

- 哦，那么转义字符呢？
R: 在字符串里面会变成单个字符，比如\n会变成换行符，不是字母也不是'.

相反，如果您实际上已经对字符串中的转义字符进行了转义(例如:"abc\\nefg")，您应该添加一个\\\\.| 在正则表达式的开头，它将匹配反斜杠 + 任何其他字符(因此它将是:\\\\.|[^a-zA-Z' ])

这是工作示例:

import re
s = "aaa\n\t\n asd123asd water's tap413 water blooe's"
replaced = re.sub("[^a-zA-Z' ]+", '', s)
print(replaced)

Would appreciate it if you can explain what each expression means

所以，解释:

关于python正则表达式，删除除撇号外的转义字符和标点符号，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47561298/