linux - AWK - 如何列匹配文件 A 中的多个匹配项匹配文件 B 中的一个匹配项

我试图在文件 A 的第 1 列和文件 B 的第 2 列之间找到匹配的字符串，并为每个匹配打印文件 A + 文件 B 的整行。问题是文件 A 的第 1 列中有多个具有相同值的字符串，当我使用 awk 解决方案时，它只打印最后一个匹配项而不是所有匹配项。

我尝试使用我之前使用过的 awk 解决方案来匹配文件 A 和文件 B 中的唯一值

awk -vOFS='\t' 'NR==FNR{a[$1]=$0;next} ($2 in a) {print a[$2],$0}' file A file B

文件A

MLLT3   26.53051423 54.24992354 25.50216856
MLLT3   24.32536694 19.96855016 177.7584507
MLLT3   18.9883621  15.83462512 115.2035222
MLLT3   11.79811105 42.91062427 77.35888553

文件B

ENSG00000171843 MLLT3   3.885477052 3.929504522 3.005321522

预期输出:

MLLT3   26.53051423 54.24992354 25.50216856 ENSG00000171843 MLLT3   3.885477052 3.929504522 3.005321522
MLLT3   24.32536694 19.96855016 177.7584507 ENSG00000171843 MLLT3   3.885477052 3.929504522 3.005321522
MLLT3   18.9883621  15.83462512 115.2035222 ENSG00000171843 MLLT3   3.885477052 3.929504522 3.005321522
MLLT3   11.79811105 42.91062427 77.35888553 ENSG00000171843 MLLT3   3.885477052 3.929504522 3.005321522

实际输出:

MLLT3   11.79811105 42.91062427 77.35888553 ENSG00000171843 MLLT3   3.885477052 3.929504522 3.00532152

我对任何解决方案都持开放态度，过去我只是使用 awk 来解决此类问题。

最佳答案

由于 key 在文件 A 中重复但在文件 B 中不重复，请尝试:

$ awk -vOFS='\t' 'NR==FNR{a[$2]=$0;next} ($1 in a) {print $0,a[$1]}' fileB fileA
MLLT3   26.53051423     54.24992354     25.50216856     ENSG00000171843 MLLT3   3.885477052     3.929504522     3.005321522
MLLT3   24.32536694     19.96855016     177.7584507     ENSG00000171843 MLLT3   3.885477052     3.929504522     3.005321522
MLLT3   18.9883621      15.83462512     115.2035222     ENSG00000171843 MLLT3   3.885477052     3.929504522     3.005321522
MLLT3   11.79811105     42.91062427     77.35888553     ENSG00000171843 MLLT3   3.885477052     3.929504522     3.005321522

关于linux - AWK - 如何列匹配文件 A 中的多个匹配项匹配文件 B 中的一个匹配项，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55738914/

linux - AWK - 如何列匹配文件 A 中的多个匹配项匹配文件 B 中的一个匹配项

上一篇：linux - 在下面的行中提取一个值并将结果与原始搜索词一起写入 (linux)

下一篇：java - java代码会导致linux中的段错误吗？

linux - AWK - 如何列匹配文件 A 中的多个匹配项匹配文件 B 中的一个匹配项

上一篇：linux - 在下面的行中提取一个值并将结果与​​原始搜索词一起写入 (linux)

下一篇：java - java代码会导致linux中的段错误吗？

上一篇：linux - 在下面的行中提取一个值并将结果与原始搜索词一起写入 (linux)