Python正则表达式用于删除奇怪的字符

标签 python regex tweepy

你好,

我有一个包含一些奇怪字符的字符串列表(例如:�)。 例如:

'Replay fortement conseillé �\x9f\x98\x82�\x9f\x98\x82'

或者:

'Le papa du mois �\x9f\x91\x8a'

我想从这些字符串中删除 �\x9f\x91\x8a 和 �\x9f\x98\x82�\x9f\x98\x82。

我尝试了这个正则表达式:((.?)\\x[0-9]([a-z]|[0-9])(.?)+)+ 但它没有不工作。我是正则表达式的新手,所以我寻求帮助。

谢谢你

最佳答案

处理这些字符可能比删除它们更好,但如果你想在 Python 中删除它们,你可以不用正则表达式来实现。

text.decode("ascii", "ignore")

此行将解码 Python 中的字节数组并仅保留 ASCII 字符。

关于Python正则表达式用于删除奇怪的字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45147479/

相关文章:

java - 正则表达式,捕获组中特定的最后一个字符类型

java - 替换大括号内的所有内容?

python - 在 django 中显示来自 tweepy python 文件的数据

python - Django MEDIA_URL 和 MEDIA_ROOT

python - 使用 Python 2.7.3 IEPD_free(32 位)在 Mac OS x 10.7.5 中运行 Scrapy 所需的文件

python - 在 Bootstrap 模式下在 flask 中闪烁消息

regex - 使用 Notepad++ 在正则表达式中查找行尾

python - 使用 Rest API 和 Tweepy 从推文下载完整的 JSON 数据,通过推文 ID 查询

python - 用户 ID 到用户名 tweepy

python - 如何使用 Python 列表中的值查询 SQLite 数据库?