我想在已知的 HTML 标签之间提取数据。例如:
Hello, <i>I<i> am <i>very</i> glad to meet you.
应该变成:
'I
very'
所以我找到了一些几乎可以做到这一点的东西。不幸的是,它只提取最后一个条目。
sed -n -e 's/.*<i>\(.*\)<\/i>.*/\1/p'
现在我可以附加任何结束标记 </i>
使用换行符,效果很好。但是有没有办法只用一个 sed 命令就可以做到这一点?
最佳答案
试一试:
sed -n 's|[^<]*<i>\([^<]*\)</i>[^<]*|\1\n|gp'
并且您的示例缺少“/”:
Hello, <i>I</i> am <i>very</i> glad to meet you.
关于html - 使用 sed 提取 HTML 标签数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3588782/