我正在寻找在 PHP 中操作 HTML 的好方法。例如,我目前遇到的问题是处理格式错误的 HTML。
我收到的输入看起来像这样:
<div>This is some <b>text
如您所见,HTML 缺少结束标记。我可以使用正则表达式或 XML 解析器来解决这个问题。但是,将来我可能不得不进行其他 DOM 操作。我想知道是否有任何好的 PHP 库可以处理类似于 Javascript 处理 DOM 操作的 DOM 操作。
最佳答案
PHP 有 a PECL extension that gives you access to the features of HTML Tidy . Tidy 是一个非常强大的库,应该能够采用这样的代码并以智能方式关闭标签。
我用它来清理分类广告系统在导入之前发送给我的格式错误的 XML 和 HTML。
关于php - PHP 中的 DOM 操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27222/