r - 使用 R 从以表达式结尾的句子中提取所有单词

标签 r regex

假设我有下一个字符串:

“palavras a serem encontradas fazer-se encontrar-se, enganar-se”

如何提取单词“fazer-se”“encontrar-se”“enganar-se”

我尝试使用 stringr 之类的

library(stringr)    
sentence <- "palavras a serem encontradas fazer-se encontrar-se, enganar-se"
str_extract_all(sentence, "se$")

我想要这样的输出:

[1] "fazer-se" "encontrar-se" "enganar-se"

最佳答案

我们可以指定单词边界 (\\b)，而不是字符串的结尾 ($)(只有一个匹配项，即在字符串末尾)，并且我们需要获取 se 子字符串之前不是空格的字符，因此使用 \\S+ 即一个或多个非空格字符

library(stringr)
str_extract_all(sentence, "\\S+se\\b")[[1]]
#[1] "fazer-se"     "encontrar-se" "enganar-se"

关于r - 使用 R 从以表达式结尾的句子中提取所有单词，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63963323/

上一篇：javascript - 无法在 forEach 循环 JavaScript 之外访问变量

下一篇：android - 重复类 com.google.android.gms.location.places.zza

相关文章：

r - 删除特定列

r - 如何根据 R 中最近的匹配时间压缩数据帧

php - 使用 PHP 正则表达式部分隐藏电子邮件地址？

regex - sed 问题。我究竟做错了什么？

python 正则表达式第一个/最短匹配

javascript - 从 dateTime 字符串转换为 javascript 日期对象

r - 是否可以缓存 `lm()` 矩阵以适应新数据？

r - 使用R Shiny中的动态输入建立线性回归

r - 提取给定行号上方和下方的 n 行(变量 n)

Python - 解码还是正则表达式？

©2024 IT工具网联系我们