假设我有下一个字符串:
“palavras a serem encontradas fazer-se encontrar-se, enganar-se”
如何提取单词“fazer-se”“encontrar-se”“enganar-se”
我尝试使用 stringr 之类的
library(stringr)
sentence <- "palavras a serem encontradas fazer-se encontrar-se, enganar-se"
str_extract_all(sentence, "se$")
我想要这样的输出:
[1] "fazer-se" "encontrar-se" "enganar-se"
最佳答案
我们可以指定单词边界 (\\b
),而不是字符串的结尾 ($
)(只有一个匹配项,即在字符串末尾),并且我们需要获取 se
子字符串之前不是空格的字符,因此使用 \\S+
即一个或多个非空格字符
library(stringr)
str_extract_all(sentence, "\\S+se\\b")[[1]]
#[1] "fazer-se" "encontrar-se" "enganar-se"
关于r - 使用 R 从以表达式结尾的句子中提取所有单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63963323/