我正在尝试编写一个正则表达式来捕获文件中的名称,其中某些行可能有 2 个或更多名称需要捕获。
例如,我想带一个文件:
Field_1 \t Field_2 \t Field_3 \t JGN;Name=hsa-123;J4N9;Name=cfa-241-b
Field_1 \t Field_2 \t Field_3 \t JPN;Name=hsa-1323;JJ39;Name=cfa-255-b;Name=hsa-188
并返回一个输出文件:
Field_1 \t Field_2 \t Field_3 \t hsa-123; cfa-241-b
Field_1 \t Field_2 \t Field_3 \t hsa-1323;cfa-255-b;hsa-188
我使用正则表达式如下:
sed 's/\(.*\)\t\(.*\)\t\(.*\)\t.*\;Name=\(.*\);.*/\1\t\2\t\3\t\4\;\4/g'
但这只会返回名字。任何建议将不胜感激
最佳答案
做
sed 's/\([[:space:]]\|;\)[[:alnum:]]*;/\1/g; s/Name=//g'
为你工作?
关于可能需要每行捕获多个表达式的正则表达式 (sed),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13076294/