我有包含多列的制表符分隔文件。我想计算一个文件夹中所有文件的列中不同值的出现频率,并按计数的降序排列(最高计数在前)。我如何在 Linux 命令行环境中完成此操作?
它可以使用任何常见的命令行语言,如 awk、perl、python 等。
最佳答案
要查看第二列的频率计数(例如):
awk -F '\t' '{print $2}' * | sort | uniq -c | sort -nr
文件A.txt
z z a
a b c
w d e
文件B.txt
t r e
z d a
a g c
文件C.txt
z r a
v d c
a m c
结果:
3 d
2 r
1 z
1 m
1 g
1 b
关于bash - 获取 bash 列中唯一值的计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4921879/