regex - 正则表达式从字符串中删除不需要的文本

标签 regex sed cut

我试图从像这样的大字符串中提取很少的信息

[[["좋은","good","joh-eun",""]],[["adjective",[["좋은",["good","nice","pretty","admirable","canny","tenacious"],,0.38553435]],"good",4],["adverb",["훌륭하게",["wonderfully","good","nicely","beautifully","fine","finely"],,0.00029145498],"good",4]]]

我想像这样提取字符串

좋은 - good
좋은 - good,nice,pretty,admirable,canny,tenacious (basically adjectives)
훌륭하게 - wonderfully,good,nicely,beautifully,fine,finely (adverbs)

请帮助我尝试使用 sed 和管道进行切割

cut --delimiter='"' -f 1-2 and then use sed 's/\[\[\[\"//'

这给了我第一个韩语 좋은 结果,我无法扩展它以获得所需的结果! 如果还有其他更好的方法来实现这一点,请提出建议。 提前致谢。

最佳答案

有点晚了,但在适合 sed 的纯正则表达式中:

正则表达式: \[\[\["(.*?)","(.*?)"\]\],\[\["(.*?)",\[\[ "(.*?)",\["(.*?)"\],.*?\]\],.*?\],\["(.*?)",\["(.* ?)",\["(.*)"\],.*\]\]\]

替换:\1 -\2\n\4 -\5 (\3)\n\7 -\8 (\6)

demo

假设原行中始终有形容词和副词括号...(即使为空)

请参阅演示中的替换,了解如何重新组织比赛。

关于regex - 正则表达式从字符串中删除不需要的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25548777/

相关文章:

linux - 如何使用 bash 命令从字符串中提取子字符串

regex - c++0x 正则表达式适用于 clang,但不适用于 gcc 4.9.2

regex - 如何优化英语单词列表

javascript - JavaScript 中的正则表达式自定义单词边界

linux - 我可以将一长串 sed 命令组合成更短的命令吗?

c - YACC 文件是否有文件包含机制?

linux - 操作 AWK 字段变量 ($1,$2,..) 并将其添加到行尾

video - 将 .osp OpenShot 项目导出到 ffmpeg 脚本,作为通过交换 hell 解决视频导出卡住或崩溃的方法

regex - 如何使用正则表达式从Travis日志中区分Maven和Gradle

c# - 为什么我不能使用此模式删除 "[restr=戸]"