regex - 如何将文本的某些部分提取到另一个文件中?

标签 regex perl text extract

这是我的代码。我希望提取部分文本并写入另一个文件。代码循环不会停止在我选择的文本范围内。它会一直读到最后一个匹配的单词行。请建议我。谢谢。例如,我需要提取 $ NAME: sandy 直到 $$.TO,然后与 $NAME: patrick 中的内容连接,从 G1 开始直到 $$SRU。

文本:

$ NAME : corry  
$$.Inc s d
$$.Oc s
$$.TO

G1 ty n1 EE EE M T1 T2 $$SRU
G2 n1 y OO OO M T3 T4 $$SRU    
$$.EON

$ NAME : patrick    
$$.Inc c d
$$.Oc c
$$.TO

G1 td n3 EE EE M T5 T6 $$SRU      
G2 n3 y OO OO M T7 T8 $$SRU    
$$.EON
$ NAME : sandy    
$$.Inc k l
$$.Oc l
$$.TO

G1 td n3 FF FF M R5 R6 $$SRU      
G2 n3 y OO OO N R7 R8 $$SRU    
$$.EON

输出:例如。

$ NAME : sandy    #from sandy section
$$.Inc k l      #sandy
$$.Oc l         #sandy
$$.TO           #sandy
G1.G1o.n ty n1 EE EE M T1 T2 $$SRU #from Patrick section
G2.G2o.n n1 y OO OO M T3 T4 $$SRU   #Patrick 
Fe.id.n ty n1 EE EE N T1 T2 $$SRU #corry
Fr.in.p n1 y OO OO N T3 T4 $$SRU   #corry 
$$.EON     #Patrick

代码:

use strict;
use warnings;

open my $F1, '<', 'testing.txt' or die "failed $!";
open my $F2, '>', 'out.txt' or die "failed $!";

while (<$F1>) {
 if (/^\$ NAME : sandy/../\$.TO/) {
 print $F2 $_;
 }
 if (/^\$ NAME : patrick/../\$.EON/) {
 if(/^G1/../\$SRU/){
 s/G1/G1.G1o.n/g;
 print $F2 $_;}
}

 }
close $F1;
close $F2;

最佳答案

您可以将所有文件解析为一个大哈希,并对其元素执行您想要的所有操作:合并、更改等

use strict;
use warnings;
use Data::Dumper;

open my $F1, '<', 'in' or die "failed $!";
open my $F2, '>', 'out.txt' or die "failed $!";


my %elements;
my $current_element;
while (<$F1>) {
    if ( /^\$ NAME : (\w+)/ .. /\$\$[.]EON/ ) {
        if ( /^\$ NAME : (\w+)/ ) {
            $current_element = $1;
        }
        if ( /^G1/ ) {
            $elements{$current_element}->{g1} .= $_;
        }
        elsif ( /^G2/ ) {
            $elements{$current_element}->{g2} .= $_;
        }
        elsif ( ! /\$\$[.]EON/ ) {
            $elements{$current_element}->{text} .= $_;
        }

    }
}
close $F1;
$elements{patrick}->{g1} =~ s/G1/G1.G1o.n/;
$elements{patrick}->{g2} =~ s/G1/G2.G2o.n/;
$elements{corry}->{g1} =~ s/G1/Fe.id.n/;
$elements{corry}->{g2} =~ s/G2/Fr.in.p/;
print $F2 "$elements{sandy}->{text}$elements{patrick}->{g1}$elements{patrick}->{g2}$elements{corry}->{g1}$elements{corry}->{g2}\n\$\$.EON";
close $F2;

这会将所有文件解析为哈希,如下所示:

  1. $elements{'名称(例如 patric'}->{text} = 'patric 部分中除 G1 和 G2 部分之外的所有内容'
  2. $elements{'名称(例如 patric'}->{g1} = 'G1 部分'
  3. $elements{'名称(例如 patric'}->{g2} = 'G2 部分'

所以如果你想结合来自 sandy 的 text 和来自 patric 的 G1 你可以这样做

my $sandy_patric = $elements{sandy}->{text}.$elements{patrick}->{g1};

关于regex - 如何将文本的某些部分提取到另一个文件中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19374551/

相关文章:

javascript - 替换选择字段中的选项(不添加)

python - 在 Pandas 中使用逗号将整列整数转换为千位分隔的字符串

正则表达式根据模式排除匹配

linux - Perl - 计算文件的字数

perl - 删除了自定义 HTTP header 字段

IOS - nsstring 文本转换为英文音标文本

regex - 在 vim 中显示与模式匹配的所有行

java - 连接到多个队列并将其消息路由到另一个队列的最有效方法

html - 如何仅使用 CSS 在 HTML 中垂直居中文本

delphi - 如何以编程方式完全证明文本合理(Delphi)?