给定以下 html:
<p>I am a paragraph</p>
<ul>
<li>Item</li>
<li>Item 2</li>
</ul>
<div class="special_div_from_email_client">
<span>Some text
我需要去掉不完整的标签。
我们正在尝试做的是通过在原始消息中放置自定义字符串来解析电子邮件消息,以便如果它包含在响应中,则可以将其删除。假设是,如果电子邮件程序将原始消息封装在任何 html 标记中,我们要删除封装的 html 标记。
最佳答案
这可能不完全是您正在寻找的内容,但我发现删除无效标签有时会破坏 HTML 电子邮件的其余部分(特别是 TR
和 TD
标签(如果您使用表格进行布局)。
最好使用这些库/工具之一来为您完成/修复 HTML。然后,您可以遍历有效 HTML 中的 DOM 来删除/修改元素。
- http://de3.php.net/manual/en/intro.tidy.php
- http://htmlpurifier.org/
- http://simplehtmldom.sourceforge.net/
这可能看起来很漫长,但我希望这会有所帮助。
关于php - 使用 PHP/HTMLPurifier 去除不完整的 HTML 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18995373/