perl - 如何用特定列中的字母替换和替换数字

标签 perl

所以我想弄清楚如何替换特定列中的数字并将该数字替换为字母。我正在用 Perl 编写代码


输入.txt

10004226549870  
204226549870062001186000000000040008060802  
5032000067470318021604226549870062001186  
603200100001312293000522105000000456000131289  
603200200006545553000522109000004242000654555  
603200300002463923000522090000005571000246392  
603200400002635413000521196000248920000263541  
60320050000175960300052196600000101700017596  
603200600001054853004867190000001003000105485  
603200700001451223000522095000003981000145122  
75030000674703180216000700017222840007  
89999990674703180216000070001722284  
9000013  

替换表

1 -> A  
2 -> B  
3 -> C  
4 -> D  
5 -> E  
6 -> F  
7 -> G  
8 -> H  
9 -> I  
0 -> {  

替换应在以下条件下发生:

Line starts with a "6", for the numbers located in column 17 and column 45.  
Line starts with a "7", for the number located in column 34.  
Line starts with a "8", for the number located in column 35.  

使用上述替换规则,生成的文件(使用当前文件作为 一个例子)将导致:

output.txt

10004226549870  
2042265498700620  
5032000067470318021604226549870062001186  
6032001000013122I3000522105000000456000131289  
6032002000065455E3000522109000004242000654555  
6032003000024639B3000522090000005571000246392  
6032004000026354A3000521196000248920000263541  
6032005000017596{300052196600000101700017596  
6032006000010548E3004867190000001003000105485  
6032007000014512B3000522095000003981000145122  
750300006747031802160007000172228D0007  
8999999067470318021600007000172228D  
9000013  

**我的代码

my $fn = 'input.txt';
my $wr = 'output.txt';

my %repl = (
    1 => "A"
    2 => "B"
    3 => "C"
    4 => "D"
    5 => "E"
    6 => "F"
    7 => "G"
    8 => "H"
    9 => "I"
    0 => "{"
);

open ( my $fh, '<', $fn ) or die "Could not open file '$fn': $!";

open ( my $ww, '>', $wr ) or die "Could not open file '$fn': $!";


my @lines;
while (my $line = <$fh>) {
    chomp $line;
    push @lines, $line;
    if ( $line =~ /^6/) {
       foreach my $key (sort keys %repl){
            substr($line, 17, 1) =~ s/\b$key\b/$repl{$key}/g
            substr($line, 45, 1) =~ s/\b$key\b/$repl{$key}/g

       }
    }

    elsif ($line =~ /^7/) {
       foreach my $key (sort keys %repl){
            substr($line, 34, 1) =~ s/\b$key\b/$repl{$key}/g

       }
    }
    elsif ($line =~ /^8/) {
       foreach my $key (sort keys %repl){
            substr($line, 35, 1) =~ s/\b$key\b/$repl{$key}/g

       }

    }
    else {
         print $ww $_;
    }
}
close $fh;

close $ww;

最佳答案

这很好,我能看到的唯一问题是您可能算错了,因为 substr计数从 0 开始。另一件事是每一行都需要写入输出文件,所以去掉最后的 else。并写出该行,无论更改与否。

不过,我会提供一个改进。不需要通过为每个键运行正则表达式来探测字符,这既浪费又昂贵。还有其他更简单高效的方法。

使用 substr当它的替换是动态决定的时候我们需要两次调用

substr $line, 16, 1, $repl{ substr $line, 16, 1 };

这将替换长度为 1 的子串在位置 17(计数从 0 开始),值在 %repl 中对于长度为 1 的子串的键在第 17 位。

但是如果字符串比要求的位置短,这一行本身就会有问题。事实上,获取 { 的行就是这种情况。作为替换,只有 44 个字符。鉴于 substr 的“特定”行为对于边缘情况,最好不要寻求“修复”,而是检查

# for $col == 45 (etc)
if (length $line >= $col) { 
    substr $line, $col-1, 1, $repl{ substr $line, $col-1, 1 };
}

可以在数组中准备这些位置,以避免分散的魔数(Magic Number)或标量。

另一种方法是使用正则表达式

$line =~ s/.{16}\K(.)/$repl{$1}/;

这匹配 16 个字符,并且 \K删除那些匹配项,这样就不需要将它们放回原处,并捕获下一个字符,然后用它在哈希中的值替换。现在,可能不存在的位置(字符串的结尾)不需要特殊处理,因为匹配会失败。

可以使用以上两个中的任何一个来代替 foreach遍历 %repl键和您的代码应该按原样工作,除了 else需要删除的分支和$line刚刚打印。我也希望你有

use warnings;
use strict;

在开始的某个地方,因为每个程序都强烈推荐这些。

匹配 6 上的一行/7/8可以,但是您可以改为使用这些数字作为键来构建哈希,并且它们的值是执行所需替换的代码引用。如果这些数字经常变化(或者如果可以有更多)然后考虑做类似的事情。


最后,print $ww $_;else分支会发出警告,因为一旦在 while 中使用了主题剂条件($line)然后$_不再提供(未定义)。

但是,这可能是一个发布问题,因为它使用 $ww而定义的句柄是 $wr , 还有一些其他错别字。

关于perl - 如何用特定列中的字母替换和替换数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62032369/

相关文章:

regex - 使用 Perl 正则表达式重叠文本替换

perl - 使用 perl 将 apache 重新启动为 www-data

Perl Mason 语法验证

javascript - mojolicious 将数组分配给 JavaScript 变量

mysql - 使用perl将特殊字符插入mysql

sql - 选择查询问题

perl - 为什么 '*' 在我的 .Rbuildignore 文件中不能作为 perl regexp?

javascript - 在新标签页中打开一个页面并在旧窗口中加载不同的 URL

javascript - Perl CGI,多个表单和多个提交按钮,在同一页面上执行操作

perl - Moose如何仅在$undef时更改属性值?