我正在从一个使用 ajax 加载 URL 且不允许串行下载的站点下载研究项目的信息。我正在转储来自 casperjs
的网址进入我阅读和使用的文件 browser.retrieve(url,dump_filename)
用mechanize
下载资料.我大多下载空白文件,但它们会定期填充内容。有没有办法修改标题,以便我始终可以获取数据。还有一个 casperjs
欢迎下载替代方案。我试过 casperjs
download() 但它也保存了一个空白文件。我认为这与标题有关。文件下载始终在浏览器中工作。
最佳答案
我更喜欢 Selenium当涉及到使用 AJAX、JS 等的更“复杂”的网站时,请忽略 Mechanize。
当您使用浏览器时,您说下载有效。好吧,Selenium 做同样的事情——它在你的桌面上使用 Firefox 来完成它的任务
关于python Mechanize 空白下载或如何在casperjs中进行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14382826/