我正在尝试清理伪 json 文件的语法。该文件太大,无法在文本编辑器 (20 gb) 中打开,因此我必须通过命令行(运行 Arch linux)完成所有这些操作。我不知道该怎么做的一件事是替换 sed 中的换行符(GNU sed v. 4.8)
具体来说,我有以下形式的数据:
{
"id" : 1,
"value" : 2
}
{
"id" : 2,
"value" : 4
}
而且我需要在闭合的大括号(但不是最后一个)后面加一个逗号。所以我希望输出看起来像:
{
"id" : 1,
"value" : 2
},
{
"id" : 2,
"value" : 4
}
理想情况下,我只是在 sed
中执行此操作,但从阅读此内容来看,sed 首先将文本展平,因此不清楚如何替换换行符。
理想情况下,我只是运行类似 sed 's/}\n{/},\n{/g' test.json
的东西,但这不起作用(也没有使用\\n\n 的位置)。
我也尝试过 awk,但遇到了类似的问题,即无法用方括号替换硬回车的组合。而且我可以用 tr 代替硬回车,但不能用字符组合。
关于如何解决这个问题有什么想法吗?
最佳答案
是的,默认情况下 sed
逐行工作。除非使用特征将多行引入模式空间,否则无法跨多行进行匹配。这是一种方法,前提是输入严格遵循所示示例:
sed '/}$/{N; s/}\n{/},\n{/}' ip.txt
/}$/
匹配行尾的}
{}
允许您对要针对特定地址执行的命令进行分组N
将下一行添加到模式空间s/}\n{/},\n{/
执行所需的替换
- 使用
-i
选项进行就地编辑
对于如下所示的序列,此解决方案可能会失败,但我假设以 }
结尾的两行不会连续出现。
}
}
{
abc
}
使用sed '/}$/{N; s/n{/},\n{/; ; D}'
如果上面的序列可以发生。
关于awk - 使用 sed(或 awk 或 tr)将换行符\n 替换为表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68923973/