具有计算值和数字范围的 awk 过滤列 |更新

标签 awk numbers compare multiple-columns

嗨,我不知道如何实现给定的预期输出 输入文件,当前代码给出输出,但需要有预期的输出

input file                     awk code output
--------

3700 TEXT_0A 34 NA NA        | 3700  TEXT_0A  34    NA   NA    850
3721 TEXT_0A 55 ete 851      | 3721  TEXT_0A  55    ete  851   850
3701 TEXT_0A 100 NA NA       | 3701  TEXT_0A  100   NA   NA    850
3724 TEXT_0A 150 ete 1275    | 3724  TEXT_0A  150   ete  1275  1275
3713 TEXT_0A 170 ete 1445    | 3713  TEXT_0A  170   ete  1445  1445
25 TEXT_XA 200 ete 822       | 3686  TEXT_0A  200   ete  822   1700
3686 TEXT_0A 200 ete 822     | 3692  TEXT_0A  200   ete  1700  1700
3692 TEXT_0A 200 ete 1700    | 3716  TEXT_0A  200   ete  3000  1700
3716 TEXT_0A 200 ete 3000    | 3688  TEXT_0A  250   ete  822   1875
88 TEXT_AF 250 ete 822       | 3708  TEXT_0A  300   ete  2250  2250
69 DNTT_AF 250 ete 822       | 3704  TEXT_0A  304   ete  2280  2280
3688 TEXT_0A 250 ete 822     | 3705  TEXT_0A  304   ete  2350  2280
3708 TEXT_0A 300 ete 2250    | 3689  TEXT_0A  400   ete  3000  3000
3704 TEXT_0A 304 ete 2280    | 3717  TEXT_0A  400   ete  3002  3000
3705 TEXT_0A 304 ete 2350    | 3706  TEXT_0A  404   ete  3030  3030
3689 TEXT_0A 400 ete 3000    | 3696  TEXT_0A  500   ete  3750  3750
3717 TEXT_0A 400 ete 3002    | 3707  TEXT_0A  650   ete  4500  4875
3706 TEXT_0A 404 ete 3030    | 3720  TEXT_0A  800   ete  3000  6000
3696 TEXT_0A 500 ete 3750    | 3694  TEXT_0A  1000  ete  7500  7500
3707 TEXT_0A 649.5 ete 4500  | 
3720 TEXT_0A 800 ete 3000    | 
3694 TEXT_0A 1000 ete 7500   | 

过滤规则:

  1. 过滤包含字符串 _0A 的行并排除包含以下内容的行 DNTT _AF _XA 基于列 $3 <=100 分配给输出列 $6 固定值850
  2. 基于列 $3 > 100 && $3 <=200 在此数字范围内 分配给输出列 $6 计算值 $3*8.5
  3. 基于列 $3 > 200 && $3 <=1000 在此数字范围内 分配给输出列 $6 计算值 $3*7.5
  4. 如果不等于列,则比较后将其过滤为预期输出 低于 5 美元和 6 美元

预期输出:

3700  TEXT_0A  34    NA   NA    850
3721  TEXT_0A  55    ete  851   850
3701  TEXT_0A  100   NA   NA    850
3686  TEXT_0A  200   ete  822   1700
3716  TEXT_0A  200   ete  3000  1700
3688  TEXT_0A  250   ete  822   1875
3705  TEXT_0A  304   ete  2350  2280
3717  TEXT_0A  400   ete  3002  3000
3707  TEXT_0A  650   ete  4500  4875
3720  TEXT_0A  800   ete  3000  6000

部分工作代码:

awk '{if (( $2 ~ /_0A/ && !/DNTT|_AF|_XA/ && $3 <=100 )) \
printf ("%s %s %.0f %s %s %.0f\n",$1,$2,$3,$4,$5,850); \
else if (( $2 ~ /_0A/ && !/DNTT|_AF|_XA/ && $3 > 100 && $3 <=200 )) \
printf ("%s %s %.0f %s %s %.0f\n",$1,$2,$3,$4,$5,$3*8.5); \
else if (( $2 ~ /_0A/ && !/DNTT|_AF|_XA/ && $3 > 200 && $3 <=1000 )) \
printf ("%s %s %.0f %s %s %.0f\n",$1,$2,$3,$4,$5,$3*7.5)}' file2 | column -t

最佳答案

读取从 1 到 4 的行,并将其转换为 awk:

gawk '$0~"_0A" && $0!~"DNTT"{ $6=(($3>100 && $3<=200)?($3*8.5):($3>200 && $3<=1000?($3*7.5):850)); if($5!=$6){ print }}' input.txt

输出:

3700 TEXT_0A 34 NA NA 850
3721 TEXT_0A 55 ete 851 850
3701 TEXT_0A 100 NA NA 850
3686 TEXT_0A 200 ete 822 1700
3716 TEXT_0A 200 ete 3000 1700
3688 TEXT_0A 250 ete 822 1875
3705 TEXT_0A 304 ete 2350 2280
3717 TEXT_0A 400 ete 3002 3000
3707 TEXT_0A 649.5 ete 4500 4871.25
3720 TEXT_0A 800 ete 3000 6000

if 语句 ( if a=b then c else d; ) 也可以写为 ( a=b?c:d )

注意:您必须排除 _AF _XA ,我不清楚,因为没有看到_XA 。这就是为什么我排除了 DNTT .

关于具有计算值和数字范围的 awk 过滤列 |更新,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64616675/

相关文章:

C++ 如何确定字母表中一个单词是否在另一个单词之前

python - 检查字符串的特定格式的子字符串,如何..?

java - 比较 System.currentTimeMillis()

linux - 根据字段拆分文件并保存在使用根名称创建的子目录中

bash - 将 txt 文件与 csv bash 中的第三列进行比较

regex - 如何对未知(但重复)的词进行分组以创建索引?

javascript - 使用 Javascript 对数值数组的数组进行排序

awk - 需要修改我的输入文件

java - 打印给定数字中的最大数字 - Java

java - 删除字符串中除 之外的所有内容。以及 0-9 之间的数字 - Java