我需要捕获一个网站,并且正在寻找合适的库或程序来执行此操作。该网站使用 Java 脚本并将更新推送到页面,我需要捕获这些更新以及页面本身。我正在使用curl 来捕获页面本身,但我不知道如何捕获更新。如果可以选择,我会使用 C++。
问候
最佳答案
安装 Firefox 和 GreaseMonkey 。让 GM 脚本在适当的地方添加 DOM 事件以跟踪修改。然后,您可以使用 XMLHttpRequest 将信息发送到服务器,或使用 XPCOM file IO opearation 将它们写入本地文件。 .
有了这个,你可以在十几行内完成你想要的事情,几乎不需要逆向工程,而其他人建议的(屏幕抓取)在我看来将需要数千行 JavaScript 重站点代码。
附录:这/不是/C++ 的工作。无论如何,如果你用 C++ 来做,你最终将不得不对 JS 进行逆向工程,所以你不妨首先学习足够的 JS 来使用 GreaseMonkey。
关于javascript - 如何以编程方式捕获强制更新的网页,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/395088/