python - 替换相同字符的序列

标签 python regex text

用 Python 替换 utf-8 文本中 3 个或更多相同字符序列的最快方法是什么?我需要用正好 2 个字符替换 3 个和更多相同字符序列。 IE。

aaa -> aa 
bbbb -> bb
abbbcd -> abbcd
124xyyyz3 -> 124xyyz3

最佳答案

>>> import re
>>> re.sub(r'(\w)\1{2,}', r'\1\1', 'aaa')
'aa'
>>> re.sub(r'(\w)\1{2,}', r'\1\1', 'bbbb')
'bb'

关于python - 替换相同字符的序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16543078/

相关文章:

PHP 正则表达式捕获第一个模式及其后的所有内容,即使它重复。

regex - 创建我自己的 html 解析器

c++ - 使用正则表达式排除 C++ 中的子文件夹

java - Pattern 中的匹配器 (java.lang.CharSequence) 无法应用于 (java.io.BufferedReader)

python - QDateEdit.date().toString ("MMMM dd, yyyy") 不显示英文月份

python - Cherrypy base64 图像编码未按预期工作

c - 用C将文本写入.txt文件

python - 为什么pygame不显示我的文本?

python - Kubernetespodoperator如何使用cmds或者cmds和arguments运行多条命令

python - 将字符串解析为 float 的 python 标准是什么?