html - 使用 Bash 获取一对 HTML 标签之间的内容

标签 html bash

我需要使用 bash 脚本获取一对给定标签之间的 HTML 内容。 例如,具有以下 HTML 代码:

<html>
<head>
</head>
<body>
 text
  <div>
  text2
    <div>
        text3
    </div>
  </div>
</body>
</html>

使用 bash 命令/脚本,给定 body 标签,我们将得到:

 text
  <div>
  text2
    <div>
    text3
    </div>
  </div>

提前致谢。

最佳答案

纯文本处理不利于html/xml解析。我希望这可以给你一些想法:

kent$  xmllint --xpath "//body" f.html 
<body>
 text
  <div>
  text2
    <div>
        text3
    </div>
  </div>
</body>

关于html - 使用 Bash 获取一对 HTML 标签之间的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55718434/

相关文章:

html - Python Mechanize HTML 代码不同于 Firebug HTML 代码

bash - 从包含正斜杠的 bash 中的变量中删除字符串的一部分

bash - 如何在 NetBeans 中保存时运行 bash 脚本?

javascript - 标题属性中的换行符在工具提示中不起作用

css - 对齐 Bootstrap touchSpin 的各种元素

javascript - AngularJS:如何在 ngView 上为每个元素放置输入动画

Python 脚本可以独立工作,但不能在 crontab 中工作

javascript - &lt;script&gt; 标签 src 属性

bash - Bash 中的“哪个”与 'command -v'

bash - 根据分隔符拆分文件,然后加入单独的行