regex - R vs sed 正则表达式贪婪

标签 regex r sed

我不太明白为什么这不会导致 "test"并希望得到解释:

a = "blah test"
sub('^.*(test|$)', '\\1', a)
# [1] ""

将其与 sed 进行比较表达:
echo 'blah test' | sed -r 's/^.*(test|$)/\1/'
# test
echo 'blah blah' | sed -r 's/^.*(test|$)/\1/'
#

Fwiw,以下实现了我在R中想要的(相当于上面的sed结果):
sub('^.*(test)|^.*', '\\1', a)

最佳答案

您需要标记 ^.*non-greedy

> sub('^.*?(test|$)', '\\1', "blah test")
[1] "test"
> sub('^.*?(test|$)', '\\1', "blah blah")
[1] ""

关于regex - R vs sed 正则表达式贪婪,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17728022/

相关文章:

r - 使用 fread() 导入大型 CSV (8 GB) 时“在字符串中嵌入 nul”

java - 通过正则表达式从行中获取彼此相邻的 3 个字符串

RegEx,选择任何不在括号中的内容

unit-testing - 我们如何测试构建 R 包时未公开的函数?

linux - 使用标准 unix 工具在文件中间插入行

sed:为什么命令 q 添加新行?

Java正则表达式替换两个标签之间的所有内容,非XML

regex - 如何从 Unix shell 变量中提取与模式匹配的子字符串

r - 将 DF 结构更改为虚拟结构

r - 随 R 变化的增量序列?