r - 使用 R 从以表达式结尾的句子中提取所有单词

标签 r regex

假设我有下一个字符串:

“palavras a serem encontradas fazer-se encontrar-se, enganar-se”

如何提取单词“fazer-se”“encontrar-se”“enganar-se”

我尝试使用 stringr 之类的

library(stringr)    
sentence <- "palavras a serem encontradas fazer-se encontrar-se, enganar-se"
str_extract_all(sentence, "se$")

我想要这样的输出:

[1] "fazer-se" "encontrar-se" "enganar-se"

最佳答案

我们可以指定单词边界 (\\b),而不是字符串的结尾 ($)(只有一个匹配项,即在字符串末尾),并且我们需要获取 se 子字符串之前不是空格的字符,因此使用 \\S+ 即一个或多个非空格字符

library(stringr)
str_extract_all(sentence, "\\S+se\\b")[[1]]
#[1] "fazer-se"     "encontrar-se" "enganar-se"  

关于r - 使用 R 从以表达式结尾的句子中提取所有单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63963323/

相关文章:

r - 删除特定列

r - 如何根据 R 中最近的匹配时间压缩数据帧

php - 使用 PHP 正则表达式部分隐藏电子邮件地址?

regex - sed 问题。我究竟做错了什么?

python 正则表达式第一个/最短匹配

javascript - 从 dateTime 字符串转换为 javascript 日期对象

r - 是否可以缓存 `lm()` 矩阵以适应新数据?

r - 使用R Shiny中的动态输入建立线性回归

r - 提取给定行号上方和下方的 n 行(变量 n)

Python - 解码还是正则表达式?