Perl 一行提取多行模式

我在文件中有一个模式如下，它可以/不能跨越多行:

 abcd25
 ef_gh
 ( fg*_h
 hj_b*
 hj ) {

我尝试过的:

perl -nle 'print while m/^\s*(\w+)\s+(\w+?)\s*(([\w-0-9,* \s]))\s{/gm'

我不知道这里的标志是什么意思，但我所做的只是为模式编写一个 regex 并将其插入模式空间。如果模式在一行中，这很匹配:

abcd25 ef_gh ( fg*_h hj_b* hj ) {

但仅在多行情况下失败!

我昨天开始使用 perl，但语法太困惑了。因此，按照我们一位 SO 伙伴的建议，我编写了一个 regex 并将其插入到他提供的代码中。

我希望 perl 和尚能在这种情况下帮助我。欢迎使用替代解决方案。

输入文件:

 abcd25
 ef_gh
 ( fg*_h
 hj_b*
 hj ) {

 abcd25
 ef_gh
 fg*_h
 hj_b*
 hj ) {

 jhijdsiokdù ()lmolmlxjk;
 abcd25 ef_gh ( fg*_h hj_b* hj ) {

预期输出:

 abcd25
 ef_gh
 ( fg*_h
 hj_b*
 hj ) {
 abcd25 ef_gh ( fg*_h hj_b* hj ) {

输入文件可以有多个模式，这些模式与所需模式的开始和结束模式一致。预先感谢您的回复。

最佳答案

对单行代码使用触发器运算符

Perl 使用触发器运算符使这变得非常容易，它允许您打印出两个正则表达式之间的所有行。例如:

$ perl -ne 'print if /^abcd25/ ... /\bhj \) {/' /tmp/foo
abcd25
ef_gh
( fg*_h
hj_b*
hj ) {

但是，像这样的简单单行代码不会区分您想要拒绝定界模式之间特定匹配的匹配项。这需要更复杂的方法。

更复杂的比较受益于条件分支

单行代码并不总是最佳选择，如果正则表达式变得过于复杂，它们很快就会失控。在这种情况下，您最好编写一个可以使用条件分支的实际程序，而不是尝试使用过于聪明的正则表达式匹配。

实现此目的的一种方法是使用简单模式构建匹配，然后拒绝与某些其他简单模式不匹配的任何匹配。例如:

#!/usr/bin/perl -nw

# Use flip-flop operator to select matches.
if (/^abcd25/ ... /\bhj \) {/) {
    push @string, $_
};

# Reject multi-line patterns that don't include a particular expression
# between flip-flop delimiters. For example, "( fg" will match, while
# "^fg" won't.
if (/\bhj \) {/) {
    $string = join("", @string);
    undef @string;
    push(@matches, $string) if $string =~ /\( fg/;
};

END {print @matches}

当针对 OP 的更新语料库运行时，这会正确产生:

abcd25
ef_gh
( fg*_h
hj_b*
hj ) {
abcd25 ef_gh ( fg*_h hj_b* hj ) {

关于Perl 一行提取多行模式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11792967/

Perl 一行提取多行模式

对单行代码使用触发器运算符

更复杂的比较受益于条件分支

上一篇：bash - 使用 Bash 重命名文件，删除前缀和后缀

下一篇：bash:如何评估 PS1、PS2、...？