我有一个多列文本文件(23 列,约 450,000 行),我想从中仅提取第 9 列中包含单词“plant”的那些行(例如)。理想情况下,我想创建一个仅包含“植物”数据的子文件,以便我可以使用 Excel 对其进行操作(原始文件不会完全加载到 Excel 上)。我过去曾使用 awk 来完成一些表解析工作,但我无法完成这项工作。我使用以下 awk 命令失败:
$ awk '$9="plant"' file_in.txt > file_out.txt
我将非常感谢您的帮助。
最佳答案
I would like to extracts only those rows that contain the word "plant" in column 9
如果这是要求,我想你会这样做:
awk '$9~/plant/' file_in.txt > file_out.txt
如果你想获取 col9 等于“plant”的行:
awk '$9=="plant"' file_in.txt > file_out.txt
顺便说一句,我不知道是否还有另一个问题@SO 标记有 linux
、awk
和 Excel
!!有趣..
关于linux - 如何选择大型文本文件中包含特定文本字符串的所有行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24142557/