linux - 从单个列快速创建文件

标签 linux perl file unix

我有一个看起来像这样的数据:

-1 1:-0.394668 2:-0.794872 3:-1 4:-0.871341 5:0.9365 6:0.75597
1 1:-0.463641 2:-0.897436 3:-1 4:-0.871341 5:0.44378 6:0.121824
1 1:-0.469432 2:-0.897436 3:-1 4:-0.871341 5:0.32668 6:0.302529
-1 1:-0.241547 2:-0.538462 3:-1 4:-0.871341 5:0.9994 6:0.987166
1 1:-0.757233 2:-0.948718 3:-1 4:-0.871341 5:-0.33904 6:0.915401
1 1:-0.167147 2:-0.589744 3:-1 4:-0.871341 5:0.95078 6:0.991566

第一列是类别,接下来的 6 列是特征。我想创建 6 个文件 对于个别功能。例如

my_input_feat1.txt 将包含

 -1 1:-0.394668
  1 1:-0.463641
   ...
  1 1:-0.757233
  1 1:-0.167147

my_input_feat2.txt 将包含

-1 2:-0.794872
...
1 2:-0.589744 

等等。我有一个执行此操作的 Perl 代码,但速度非常慢。有没有 一种更快的方法?通常,输入文件将包含 10 万行。

use strict;
use Data::Dumper;
use Carp;
my $input = $ARGV[0] || "myinput.txt";




my  $INFILE_file_name = $input;     # input file name

open ( INFILE, '<', $INFILE_file_name )
    or croak "$0 : failed to open input file $INFILE_file_name : $!\n";

    my $out1 = $input."_feat_1.txt";
    my $out2 = $input."_feat_2.txt";
    my $out3 = $input."_feat_3.txt";
    my $out4 = $input."_feat_4.txt";
    my $out5 = $input."_feat_5.txt";
    my $out6 = $input."_feat_6.txt";

    unlink($out1);
    unlink($out2);
    unlink($out3);
    unlink($out4);
    unlink($out5);
    unlink($out6);

    print "$out1\n";

while ( <INFILE> ) {
    chomp;
    my @els = split(/\s+/,$_);
    my $lbl = $els[0];

    my  $OUTFILE1_file_name = $out1;        # output file name
    open ( OUTFILE1, '>>', $OUTFILE1_file_name )
        or croak "$0 : failed to open output file $OUTFILE1_file_name : $!\n";
    print OUTFILE1 "$lbl $els[1]\n";
    close ( OUTFILE1 );         # close output file

    my  $OUTFILE2_file_name = $out2;        # output file name
    open ( OUTFILE2, '>>', $OUTFILE2_file_name )
        or croak "$0 : failed to open output file $OUTFILE2_file_name : $!\n";
    print OUTFILE2 "$lbl $els[2]\n";
    close ( OUTFILE2 );         # close output file

   # Etc.. until OUTFILE 6

}

close (INFILE);

最佳答案

您应该将打开/关闭输出文件移到 while 循环之外。

关于linux - 从单个列快速创建文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4655322/

相关文章:

linux - 不符合我条件的 lftp 镜像目录

perl Digest add addfile 计算不同的 SHA1 摘要

bash - 映射两个文件中的名称并获取单个文件

linux - 通过从文件读取输入来创建目录和下载文件

ruby-on-rails - 每当 cron 中的 gem 命令不起作用时

perl - 为忏悔/鲤鱼信息着色

linux - 如何编辑一个大文件

C++。从字节数组中获取RGB

python - 如何在python中将整数列表写入二进制文件

linux - WHOIS 服务器守护进程