我有一个这样的文件:
1 2 3
4 5 6
7 6 8
9 6 3
4 4 4
有哪些单行语句可以将第 n 列的唯一元素输出到另一个文件?
编辑:这是人们给出的解决方案列表。多谢你们!
cat in.txt | cut -d' ' -f 3 | sort -u
cut -c 1 t.txt | sort -u
awk '{ print $2 }' cols.txt | uniq
perl -anE 'say $F[0] unless $h{$F[0]}++' filename
最佳答案
在 5.10
之前的 Perl 中
perl -lane 'print $F[0] unless $h{$F[0]}++' filename
在 Perl 中
5.10
之后perl -anE 'say $F[0] unless $h{$F[0]}++' filename
替换
0
与您要输出的列。对于 j_random_hacker,这是一个使用很少内存的实现(但会更慢并且需要更多的输入):
perl -lane 'BEGIN {dbmopen %h, "/tmp/$$", 0600; unlink "/tmp/$$.db" } print $F[0] unless $h{$F[0]}++' filename
dbmopen在 DBM 之间创建一个接口(interface)文件(它创建或打开)和名为 %h 的哈希。存储在 %h 中的任何内容都将存储在磁盘上而不是内存中。使用 unlink 删除文件确保程序完成后文件不会保留,但对当前进程没有影响(因为根据 POSIX 规则,文件系统将打开的文件句柄视为真实文件)。
关于perl - 有哪些单行语句可以将第 n 列的唯一元素输出到另一个文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1276041/