<分区>
我正在使用 perl 模块 HTML::DOM
( link to CPAN ) 从 HTML 代码构建 HTML DOM 树,然后使用标准 DOM 的 removeAttribute
更改它,removeChild
、innerHTML
、createElement
等。
但是,我发现它真的非常非常慢并且消耗了太多内存(无论如何它完全在 perl 中)。所以,我认为会有一些 C/C++ 库可以更快、更有效地完成它(因为它发生在每个支持 JavaScript 的浏览器中)。
到目前为止,我还没有找到任何东西。也许我搜索错了?
编辑:我会补充。如果它的工作方式与链接的 Perl 模块类似,我会喜欢它——我的意思是这样我就可以直接使用 HTML 的 innerHTML
、className
、idName
...这是可行的,还是我需要使用通用的 XML 解析器然后自己编写这些?
edit2:好的,Perl 模块的缓慢实际上完全是我的错。然而,既然我已经问过了,问题仍然存在:)