awk - 使用 sed(或 awk 或 tr)将换行符\n 替换为表达式

标签 awk sed grep tr

我正在尝试清理伪 json 文件的语法。该文件太大,无法在文本编辑器 (20 gb) 中打开,因此我必须通过命令行(运行 Arch linux)完成所有这些操作。我不知道该怎么做的一件事是替换 sed 中的换行符(GNU sed v. 4.8)

具体来说,我有以下形式的数据:

{
    "id" : 1,
    "value" : 2
}
{
    "id" : 2,
    "value" : 4
}

而且我需要在闭合的大括号(但不是最后一个)后面加一个逗号。所以我希望输出看起来像:

{
    "id" : 1,
    "value" : 2
},
{
    "id" : 2,
    "value" : 4
}

理想情况下,我只是在 sed 中执行此操作,但从阅读此内容来看,sed 首先将文本展平,因此不清楚如何替换换行符。 理想情况下,我只是运行类似 sed 's/}\n{/},\n{/g' test.json 的东西,但这不起作用(也没有使用\\n\n 的位置)。

我也尝试过 awk,但遇到了类似的问题,即无法用方括号替换硬回车的组合。而且我可以用 tr 代替硬回车,但不能用字符组合。

关于如何解决这个问题有什么想法吗?

最佳答案

是的,默认情况下 sed 逐行工作。除非使用特征将多行引入模式空间,否则无法跨多行进行匹配。这是一种方法,前提是输入严格遵循所示示例:

sed '/}$/{N; s/}\n{/},\n{/}' ip.txt
  • /}$/ 匹配行尾的 }
    • {} 允许您对要针对特定​​地址执行的命令进行分组
    • N 将下一行添加到模式空间
    • s/}\n{/},\n{/ 执行所需的替换
  • 使用 -i 选项进行就地编辑

对于如下所示的序列,此解决方案可能会失败,但我假设以 } 结尾的两行不会连续出现。

}
}
{
abc
}

使用sed '/}$/{N; s/n{/},\n{/; ; D}' 如果上面的序列可以发生。

关于awk - 使用 sed(或 awk 或 tr)将换行符\n 替换为表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68923973/

相关文章:

linux - 如何替换 bash 脚本中的 'bc' 工具?

linux - 使用 sed 的输出一段时间读取循环

linux - 如何仅提取从 diff 命令返回的文件名?

linux - 如何在 Linux 中显示以小写字母或大写字母开头的目录?

arrays - 使用 bash/awk 将字符串拆分为数组

linux - 在文件中查找唯一字符串,向上一行并追加?

linux - 查找包含另一个文件中所有单词/行的所有文件

regex - 用 sed 或 replace 替换文件中的特定模式

csv 文件 - 删除字符串中间的换行符

linux - grep 字符后面没有字符