html - 使用 sed 提取 HTML 标签数据

我想在已知的 HTML 标签之间提取数据。例如:

Hello, <i>I<i> am <i>very</i> glad to meet you.

应该变成:

'I

very'

所以我找到了一些几乎可以做到这一点的东西。不幸的是，它只提取最后一个条目。

sed -n -e 's/.*<i>\(.*\)<\/i>.*/\1/p'

现在我可以附加任何结束标记 </i>使用换行符，效果很好。但是有没有办法只用一个 sed 命令就可以做到这一点？

最佳答案

试一试:

sed -n 's|[^<]*<i>\([^<]*\)</i>[^<]*|\1\n|gp'

并且您的示例缺少“/”:

Hello, <i>I</i> am <i>very</i> glad to meet you.

关于html - 使用 sed 提取 HTML 标签数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3588782/

相关文章：

ios - 使用标签处理时 UIButton 图像未正确设置