html - 使用 sed 提取 HTML 标签数据

标签 html sed tags

我想在已知的 HTML 标签之间提取数据。例如:

Hello, <i>I<i> am <i>very</i> glad to meet you.

应该变成:

'I

very'

所以我找到了一些几乎可以做到这一点的东西。不幸的是,它只提取最后一个条目。

sed -n -e 's/.*<i>\(.*\)<\/i>.*/\1/p'

现在我可以附加任何结束标记 </i>使用换行符,效果很好。但是有没有办法只用一个 sed 命令就可以做到这一点?

最佳答案

试一试:

sed -n 's|[^<]*<i>\([^<]*\)</i>[^<]*|\1\n|gp'

并且您的示例缺少“/”:

Hello, <i>I</i> am <i>very</i> glad to meet you.

关于html - 使用 sed 提取 HTML 标签数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3588782/

相关文章:

ios - 使用标签处理时 UIButton 图像未正确设置

html - 链接到网页的特定部分

html - 将图标放入 SVG 圆圈

javascript - 有没有办法在没有实例的情况下获取 css 类的值?

javascript - 使用 jquery 检测光标是否在定义的区域中

bash - shell 脚本中的连接和 'basename' 的使用

javascript - Rails 表单 - 通过 JavaScript 根据另一个选定选项更改选择选项

awk:对最后一个单词的文本 block 进行分组在两个文本文件中都很常见

regex - 使用 SED 交换 bash 中的列而不使用循环

wordpress - 如何在自定义帖子类型循环中将帖子标签添加为类?