python Mechanize 空白下载或如何在casperjs中进行

标签 python mechanize casperjs

我正在从一个使用 ajax 加载 URL 且不允许串行下载的站点下载研究项目的信息。我正在转储来自 casperjs 的网址进入我阅读和使用的文件 browser.retrieve(url,dump_filename)mechanize下载资料.我大多下载空白文件,但它们会定期填充内容。有没有办法修改标题,以便我始终可以获取数据。还有一个 casperjs欢迎下载替代方案。我试过 casperjs download() 但它也保存了一个空白文件。我认为这与标题有关。文件下载始终在浏览器中工作。

最佳答案

我更喜欢 Selenium当涉及到使用 AJAX、JS 等的更“复杂”的网站时,请忽略 Mechanize。

当您使用浏览器时,您说下载有效。好吧,Selenium 做同样的事情——它在你的桌面上使用 Firefox 来完成它的任务

关于python Mechanize 空白下载或如何在casperjs中进行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14382826/

相关文章:

ruby - 如何在没有表单的页面上使用 Mechanize?

Perl WWW::Mechanize foreach 循环跟踪链接并查看它们是否给出 401 响应

javascript - CasperJS 不发出我的 AJAX 请求

Windows 上 Jupyter 笔记本中的 Python 路径

python - 在 Windows 机器上运行 python 与 Linux

python - 解析 BeautifulSoup 中 select 下的所有选项

javascript - 使用 casperjs 从 SVG 对象访问 'd' 元素

python - 在将项目添加到列表之前,如何按字母顺序对其进行排序?

python - 计算两个点阵列之间成对角度的矩阵

javascript - while 循环的 casperjs 脚本中的异步进程