我有一个页面,其中包含爬虫提供的动态内容。但有时此内容在 HTML 中存在问题(没有关闭标签、标签关闭而不打开等)。所以,这个错误的内容破坏了整个页面,因为关闭或打开了他们不应该打开的东西。
HTML 的常见错误。
<div><p>foo</p>
<p>bar</p></div>
<p><a>link</p></a>
如何将这些内容放入沙盒中才不会破坏页面?由于 SEO,无法使用 iframe。
最佳答案
如何处理动态内容以找出哪些标签尚未关闭,并(使用堆栈)将它们添加到末尾或必要的地方(以确保正确的标签嵌套)?但是,如果您确实要使用此方法,我建议在客户端执行此操作。
关于html - 没有 iframe 的沙盒到 HTML?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12082255/