我试图从像这样的大字符串中提取很少的信息
[[["좋은","good","joh-eun",""]],[["adjective",[["좋은",["good","nice","pretty","admirable","canny","tenacious"],,0.38553435]],"good",4],["adverb",["훌륭하게",["wonderfully","good","nicely","beautifully","fine","finely"],,0.00029145498],"good",4]]]
我想像这样提取字符串
좋은 - good
좋은 - good,nice,pretty,admirable,canny,tenacious (basically adjectives)
훌륭하게 - wonderfully,good,nicely,beautifully,fine,finely (adverbs)
请帮助我尝试使用 sed 和管道进行切割
cut --delimiter='"' -f 1-2 and then use sed 's/\[\[\[\"//'
这给了我第一个韩语 좋은 结果,我无法扩展它以获得所需的结果! 如果还有其他更好的方法来实现这一点,请提出建议。 提前致谢。
最佳答案
有点晚了,但在适合 sed 的纯正则表达式中:
正则表达式: \[\[\["(.*?)","(.*?)"\]\],\[\["(.*?)",\[\[ "(.*?)",\["(.*?)"\],.*?\]\],.*?\],\["(.*?)",\["(.* ?)",\["(.*)"\],.*\]\]\]
替换:\1 -\2\n\4 -\5 (\3)\n\7 -\8 (\6)
假设原行中始终有形容词和副词括号...(即使为空)
请参阅演示中的替换,了解如何重新组织比赛。
关于regex - 正则表达式从字符串中删除不需要的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25548777/