你好,
我有一个包含一些奇怪字符的字符串列表(例如:�)。 例如:
'Replay fortement conseillé �\x9f\x98\x82�\x9f\x98\x82'
或者:
'Le papa du mois �\x9f\x91\x8a'
我想从这些字符串中删除 �\x9f\x91\x8a 和 �\x9f\x98\x82�\x9f\x98\x82。
我尝试了这个正则表达式:((.?)\\x[0-9]([a-z]|[0-9])(.?)+)+
但它没有不工作。我是正则表达式的新手,所以我寻求帮助。
最佳答案
处理这些字符可能比删除它们更好,但如果你想在 Python 中删除它们,你可以不用正则表达式来实现。
text.decode("ascii", "ignore")
此行将解码 Python 中的字节数组并仅保留 ASCII 字符。
关于Python正则表达式用于删除奇怪的字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45147479/