我正在寻找一种从命令行处理网页和相关 Javascript 的方法,以便可以输出生成的 DOM 模型。
这样做的目的是在不使用正则表达式进行任何讨厌的 HTML(和 Javascript)解析的情况下识别页面中的表单。
是否有任何命令行工具可以执行此操作?所以假设地说,一个命令行网络浏览器下载内容并将 DOM 作为文本输出,而不是生成一个漂亮的页面。
最佳答案
我什么都不知道,但我想强调你所建议的一个困难:
process a web page and associated Javascript
什么时候输出?许多网页都有时间敏感的 javascript,或者会影响 DOM 的 onclick/onhover 脚本。你希望这些被执行吗?全部,还是只有一部分?确定页面何时“完成”并准备好输出 DOM 并非易事在 javascript 操作之后。 (在 javascript 操作之前,这是一个更容易的问题;只需等到 document.DOMReady 事件...)
编辑:我并不是说您根本不需要执行 javascript:您可能希望在加载期间处理任何 document.write 部分,因为它们可能会写出一个表单...我是说这很难知道你什么时候完成了“足够”的 javascript...
关于testing - 输出 DOM 的命令行 Web 浏览器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1204684/