正则表达式新手警报,请保持温柔。我有这样的字符串:
sent = 'The type of vehicle FRFR7800 is the fastest'
我想删除重复出现的子字符串“FR”。所以字符串应该是:
sent = 'The type of vehicle FR7800 is the fastest'.
我想我已经花了两个多小时阅读/尝试 re 的教程以及更Pythonic的方式groupby我实在想不通。我还搜索了类似的问题,大多数结果都涵盖了重复相同字符的情况,例如有像“dddddaaaaaggggg”等字符串。其中一些有帮助,但我最终删除了所有出现的“FR”。
例如我尝试过:
sent = re.sub(r'FC{1}', '', sent)
sent = re.sub(r'FC|', '', sent)
这些完全消除了“FR”的出现。当我将其更改为:
sent = re.sub(r'FC{2}', '', sent)
什么也没发生,字符串仍然重复出现“FR”。
有人可以帮助我或给我提示吗?
最佳答案
import re
sent = "The type of vehicle FRFR7800 is the fastest"
regex = r"(\w{2})\1"
print(re.sub(regex, r"\g<1>", sent))
关于python - python 删除字符串中的字符组合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66468650/