unix - 使用 awk 对齐字段分隔符为 '|' 或管道的各个字段

标签 unix awk delimiter

以下是员工列表,每个员工的信息都存储在文件 emp.lst 中:

2233|a.k. shukla|g.m.|sales|12/12/52|6000
9876|jai sharma|director|production|12/03/50|7000
5678|sumith chakrobarty|d.g.m.|marketing|19/04/43|6000
2365|barun sengupta|director|personnel|11/05/47|7800
5423|n.k. gupta|chairman|admin|30/08/56|5400
1006|chanchal singhvi|director|sales|03/09/38|6700
6213|karuna ganguly|g.m|accounts|05/06/62|6300
1265|s.n. dasgupta|manager|sales|12/09/63|5600
4290|jayant Choudhary|executive|production|07/09/50|6000
2476|anil aggarwal|manager|sales|01/05/59|5000
6521|lalit chowdury|director|marketing|26/09/45|8200
3212|shyam saksena|d.g.m.|accounts|12/12/55|6000
3564|sudhir Agarwal|executive|personnel|06/07/47|7500
2345|j.b. saxena|g.m|marketing|12/03/45|8000
0110|v.k. agarwal|g.m|marketing|31/12/40|9000

我想对齐此信息,以便每个字段的开头,其中字段分隔符为“|”或管道,从相同的列号开始。示例:所有名称都从第 6 列开始存储,其余字段类似。 我发现的一种解决方案是使用 printf,而不是 print。 printf 可以格式化输出。在这里我发现打印时可以为每个字段保留固定数量的空格。 例如:

$ awk 'BEGIN{ FS="|"; OFS="|" }1 { printf "%4s %20s %10s %10s %8s %s\n", $1, $2, $3, $4, $5, $6}' emp.lst

现在,第一个字段保留 4 个空格,第二个字段保留 20 个空格,第三个字段保留 10 个空格,依此类推。 这很好用。这是我编写上述命令时在终端上得到的输出:

2233          a.k. shukla       g.m.      sales 12/12/52 6000
9876           jai sharma   director production 12/03/50 7000
5678   sumith chakrobarty     d.g.m.  marketing 19/04/43 6000
2365       barun sengupta   director  personnel 11/05/47 7800
5423           n.k. gupta   chairman      admin 30/08/56 5400
1006     chanchal singhvi   director      sales 03/09/38 6700
6213       karuna ganguly        g.m   accounts 05/06/62 6300
1265        s.n. dasgupta    manager      sales 12/09/63 5600
4290     jayant Choudhary  executive production 07/09/50 6000
2476        anil aggarwal    manager      sales 01/05/59 5000
6521       lalit chowdury   director  marketing 26/09/45 8200
3212        shyam saksena     d.g.m.   accounts 12/12/55 6000
3564       sudhir Agarwal  executive  personnel 06/07/47 7500
2345          j.b. saxena        g.m  marketing 12/03/45 8000
0110         v.k. agarwal        g.m  marketing 31/12/40 9000

现在一切都很好,只是字段不再由分隔符“|”分隔如何将分隔符保留为“|” ? 我由此推测,内置变量 OFS 由于某种原因在上述命令中不起作用:

OFS=“|”

最佳答案

当您使用printf时,OFS的设置变为无操作。您必须在 printf 语句中显式放置分隔符。例如:

$ awk -F'|' '{printf "%4s|%20s|%10s|%10s|%8s|%s\n", $1, $2, $3, $4, $5, $6}' file
2233|         a.k. shukla|      g.m.|     sales|12/12/52|6000
9876|          jai sharma|  director|production|12/03/50|7000
5678|  sumith chakrobarty|    d.g.m.| marketing|19/04/43|6000
2365|      barun sengupta|  director| personnel|11/05/47|7800
5423|          n.k. gupta|  chairman|     admin|30/08/56|5400
1006|    chanchal singhvi|  director|     sales|03/09/38|6700
6213|      karuna ganguly|       g.m|  accounts|05/06/62|6300
1265|       s.n. dasgupta|   manager|     sales|12/09/63|5600
4290|    jayant Choudhary| executive|production|07/09/50|6000
2476|       anil aggarwal|   manager|     sales|01/05/59|5000
6521|      lalit chowdury|  director| marketing|26/09/45|8200
3212|       shyam saksena|    d.g.m.|  accounts|12/12/55|6000
3564|      sudhir Agarwal| executive| personnel|06/07/47|7500
2345|         j.b. saxena|       g.m| marketing|12/03/45|8000
0110|        v.k. agarwal|       g.m| marketing|31/12/40|9000

关于unix - 使用 awk 对齐字段分隔符为 '|' 或管道的各个字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23545448/

相关文章:

linux - 从 Linux 中的多个文件中删除文本行

hadoop - 如何为制表符分隔的数据编写PIG UDF并在左侧添加时间戳?

c++ - Boost.Regex 分隔符解析

c++ - C++ 未定义对 main 的引用时出错

unix - 如何在Unix中修改文件的 'last status change'(ctime)属性?

c++ - XShm 完成事件未设置显示文件描述符

python - 错误的命名链接搜索和替换

csv - (sed/awk) 如何将字段分隔(如 csv)文件转换为具有固定大小的制表符分隔列的 txt?

shell - 在 linux bourne shell : How to count the occurrences of a specific word in a file

Java解析-分隔符也可以是标记的一部分