这是我的代码。我希望提取部分文本并写入另一个文件。代码循环不会停止在我选择的文本范围内。它会一直读到最后一个匹配的单词行。请建议我。谢谢。例如,我需要提取 $ NAME: sandy 直到 $$.TO,然后与 $NAME: patrick 中的内容连接,从 G1 开始直到 $$SRU。
文本:
$ NAME : corry
$$.Inc s d
$$.Oc s
$$.TO
G1 ty n1 EE EE M T1 T2 $$SRU
G2 n1 y OO OO M T3 T4 $$SRU
$$.EON
$ NAME : patrick
$$.Inc c d
$$.Oc c
$$.TO
G1 td n3 EE EE M T5 T6 $$SRU
G2 n3 y OO OO M T7 T8 $$SRU
$$.EON
$ NAME : sandy
$$.Inc k l
$$.Oc l
$$.TO
G1 td n3 FF FF M R5 R6 $$SRU
G2 n3 y OO OO N R7 R8 $$SRU
$$.EON
输出:例如。
$ NAME : sandy #from sandy section
$$.Inc k l #sandy
$$.Oc l #sandy
$$.TO #sandy
G1.G1o.n ty n1 EE EE M T1 T2 $$SRU #from Patrick section
G2.G2o.n n1 y OO OO M T3 T4 $$SRU #Patrick
Fe.id.n ty n1 EE EE N T1 T2 $$SRU #corry
Fr.in.p n1 y OO OO N T3 T4 $$SRU #corry
$$.EON #Patrick
代码:
use strict;
use warnings;
open my $F1, '<', 'testing.txt' or die "failed $!";
open my $F2, '>', 'out.txt' or die "failed $!";
while (<$F1>) {
if (/^\$ NAME : sandy/../\$.TO/) {
print $F2 $_;
}
if (/^\$ NAME : patrick/../\$.EON/) {
if(/^G1/../\$SRU/){
s/G1/G1.G1o.n/g;
print $F2 $_;}
}
}
close $F1;
close $F2;
最佳答案
您可以将所有文件解析为一个大哈希,并对其元素执行您想要的所有操作:合并、更改等
use strict;
use warnings;
use Data::Dumper;
open my $F1, '<', 'in' or die "failed $!";
open my $F2, '>', 'out.txt' or die "failed $!";
my %elements;
my $current_element;
while (<$F1>) {
if ( /^\$ NAME : (\w+)/ .. /\$\$[.]EON/ ) {
if ( /^\$ NAME : (\w+)/ ) {
$current_element = $1;
}
if ( /^G1/ ) {
$elements{$current_element}->{g1} .= $_;
}
elsif ( /^G2/ ) {
$elements{$current_element}->{g2} .= $_;
}
elsif ( ! /\$\$[.]EON/ ) {
$elements{$current_element}->{text} .= $_;
}
}
}
close $F1;
$elements{patrick}->{g1} =~ s/G1/G1.G1o.n/;
$elements{patrick}->{g2} =~ s/G1/G2.G2o.n/;
$elements{corry}->{g1} =~ s/G1/Fe.id.n/;
$elements{corry}->{g2} =~ s/G2/Fr.in.p/;
print $F2 "$elements{sandy}->{text}$elements{patrick}->{g1}$elements{patrick}->{g2}$elements{corry}->{g1}$elements{corry}->{g2}\n\$\$.EON";
close $F2;
这会将所有文件解析为哈希,如下所示:
- $elements{'名称(例如 patric'}->{text} = 'patric 部分中除 G1 和 G2 部分之外的所有内容'
- $elements{'名称(例如 patric'}->{g1} = 'G1 部分'
- $elements{'名称(例如 patric'}->{g2} = 'G2 部分'
所以如果你想结合来自 sandy 的 text
和来自 patric 的 G1
你可以这样做
my $sandy_patric = $elements{sandy}->{text}.$elements{patrick}->{g1};
关于regex - 如何将文本的某些部分提取到另一个文件中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19374551/