python - 使用 HTTrack 镜像单个页面

标签 python http command-line wget httrack

我一直在尝试使用 HTTrack 来镜像单个页面(下载 html + 先决条件:样式表、图像等),类似于问题 [使用 httrack 镜像单个页面][1]。但是,那里接受的答案对我不起作用,因为我使用的是 Windows(其中 wget “存在”实际上是 Invoke-WebRequest 的包装器并且不以完全相同的方式运行)。

HTTrack 真的想要 (a) 下载我指向的整个网站,或者 (b) 只下载我指向的页面,让所有图像仍然存在于网络上。有没有办法让 HTTrack 下载只够离线正确查看单个页面 - 相当于 wget -p

最佳答案

这是一篇旧帖子,所以您现在可能已经明白了。我刚刚看到您的帖子,正在寻找有关使用 Python 和 HTTrack 的另一个答案。我遇到了与您遇到的问题相同的问题,我传递了参数 -r2 并下载了图像。

我的论点基本上是这样的: cmd = [httrack, myURL,'-%v','-r2','-F',"Mozilla/5.0 (Windows NT 6.1; Win64; x64)",'-O',saveLocation]

关于python - 使用 HTTrack 镜像单个页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34796053/

相关文章:

http - Accept* HTTP header 中的 q=0.5 是什么?

command-line - 如果存在命令行选项,如何绕过 MFC 应用程序中的 GUI?

command-line - 如何从命令行监控Windows上的网络流量

linux - 如何使用命令行控制 libreOffice 中的幻灯片放映?

python - 检索列表中 NaN 的索引

python - 使用 Cython distutils 时如何删除文档字符串?

http - URI 是否不区分大小写?

python - 关于Python函数max()和ifelse结构耗时的问题

python - 如何使用多部分seaborn图迭代填充matplotlib gridspec?

http - 使用 .htaccess 强制 HTTPS 请求