正则表达式删除单词,如果它在 R 中同时多次包含字母/特殊字符

标签 regex string r gsub

我想删除那些单词中字母/特殊字符数同时出现两次以上的单词。

例如,输入就像

"Google in theee lland of whhhat c#, c++ and e###"

并且输出应该是
"Google in lland of c#, c++ and"

最佳答案

x <- "Google in theee lland of whhhat c#, c++ and e###"
gsub("\\S*(\\S)\\1\\1\\S*\\s?", "", x)
# [1] "Google in lland of c#, c++ and "
(\\S)\\1\\1查找单个非空格字符的三个连续重复序列。

周边\\S*\\S*\\s?只需捕获同一个单词中的前后字符,以及紧跟在该单词之后的任何单个空格。

关于正则表达式删除单词,如果它在 R 中同时多次包含字母/特殊字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22888528/

相关文章:

c++ - 正则表达式搜索匹配不使用组

Java RegEx 查找方法名称

regex - 在 R 函数的 list.files 中使用正则表达式

r - shinydashboard::box 中的 splitLayout

R函数找到列中异常值的百分比?

php - 通过 php/regex 删除 utm 源

javascript - 如何检查正则表达式中的@?

Mysql:用键对字符串进行异或

python - 将 python 中的字符串替换为字母表序列

java - java中递归函数的字符串返回值