PHP:如何获取 HTML 元素的正确结束标记

标签 php regex xpath domdocument

假设我有一个 HTML 页面如下:

<!-- This is the opening tag -->
<div class="content_text">
  <div>Title</div>
  <div>Author Name</div>
  <div>Some complicated HTML elements correctly validated</div>
  <b>Some more text</b>
  <img ... />
  <div> more and more text </div>
</div><!-- This is the correct closing tag -->

如何获取带有 class="content_text" 的 div 开头与其正确的结束标记之间的内容?

我尝试了正则表达式,但找不到任何简单甚至困难的方法。

我试过了 XPath , 但我仍然无法获取内容。相反,我在外部 div 中获取了文本。

最佳答案

您可以使用 PHP Simple HTML DOM ParserDOMDocument 解析 XML 一样解析 HTML。

Note: PHP has support for DOMDocument directly as well.

关于PHP:如何获取 HTML 元素的正确结束标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15913457/

相关文章:

xpath - Xpath:基于父值的查询中的异常

python - XPath 选择条件匹配节点之后的节点

php - mysql php 用户带宽配额管理

php - 将子目录中的 JSON 索引文件重定向到 PHP Controller

php - 使用 symfony2 中的 twig 表单验证表单是否为 null/未定义

java - 单字母单词的正则表达式

php - Octobercms YAML 选择

java - 使用正则表达式将字符串与 JSON 字符串进行匹配

regex - 如何仅捕获 id 的一部分?

xml - 寻找一个通过 X-Path 读取和查询大型 XML 文件的工具