regex - Grep 查找以特定字符结尾的字符串

标签 regex bash grep

有没有办法使用扩展的正则表达式来查找以字符串结尾的特定模式。

我的意思是,我想匹配前 3 行而不是最后一行:

file_number_one.pdf # comment
file_number_two.pdf # not interesting
testfile_number____three.pdf # some other stuff
myfilezipped.pdf.zip some comments and explanations

我知道在 grep 中,元字符 $ 匹配行尾,但我对匹配行尾不感兴趣,而是匹配字符串尾。 grep 中的组很奇怪,我还不是很了解。

我尝试过组匹配,实际上我有一个类似的 REGEX,但它不适用于 grep -E

(\w+).pdf$

有没有办法在 grep/egrep 中进行字符串结尾匹配?

最佳答案

您的示例也适用于匹配字符串后的空格:

grep -E '\.pdf ' input.txt

你所说的“string”类似于grep所说的“word”。一个单词是一连串的字母数字字符。单词的好处是您可以将单词结尾与特殊的 \> 匹配。 , 它匹配一个单词结尾和一个零字符长度的行进。这也在行尾匹配。但是单词字符不能改变,不包含标点符号,所以不能使用。

如果你也需要在行尾匹配,单词后没有空格,使用:

grep -E '\.pdf |\.pdf$' input.txt

包括文件名后的字符不是空格字符的情况' ',但其他空格,如制表符,\t , 或者名称后直接跟注释,以 # 开头,使用:

grep -E '\.pdf[[:space:]#]|\.pdf$' input.txt

我也会说明词边界的匹配,因为那将是完美的解决方案,除了我们不能在这里使用它,因为我们不能改变被视为词的一部分的字符集。

输入包含foo作为单独的单词,并作为较长单词的一部分,其中 foo不在单词的末尾,因此不在单词边界:

$ printf 'foo bar\nfoo.bar\nfoobar\nfoo_bar\nfoo\n'
foo bar
foo.bar
foobar
foo_bar
foo

现在,为了匹配单词的边界,我们可以使用 \<一开始,\>匹配结尾:

$ printf 'foo bar\nfoo.bar\nfoobar\nfoo_bar\nfoo\n' | grep 'foo\>'
foo bar
foo.bar
foo

注意如何 _匹配为单词 char - 但除此之外,wordchars 只是字母数字,[a-zA-Z0-9] .
还要注意如何 foo行尾匹配 - 在仅包含 foo 的行中.我们不需要行尾的特殊情况。

关于regex - Grep 查找以特定字符结尾的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26497447/

相关文章:

html - 如何在终端中解析html文本文件?

linux - 如果找到关键字,则删除定界符之间的模式

bash - 获取两个字符之间的字符串和以逗号作为分隔符的输出字段

Javascript正则表达式匹配URL但不匹配文件名

linux - 使用 Last 和 tr 剪切行和列

javascript - 如何用双引号替换“&ldquo?

linux - 从另一个具有动态路径的 bash 脚本调用 bash 脚本

linux - 比较linux中两个未排序的列表,列出第二个文件中的唯一性

javascript - 正则表达式获取带空格的字符串

用于强密码验证的 PHP 正则表达式