linux - 'wget' 基于框架的完整网站

标签 linux wget

我有个小问题。我要递归下载 that web page ,但它基于“框架”。标准方法帮不了我。我尝试了不同的变体,但没有。我最多可以下载一个递归,我找到了例子 there .我怎样才能完全捕获那个网站,而不是离线使用它?谢谢。

最佳答案

如果您想要站点的本地副本,请使用 --mirror:

wget --mirror http://www.example.com/

其他一些选项也很有用:

--convert-links 将绝对链接转换为本地链接,以便您可以在本地浏览网站。

--HTML-extension 将 .html 添加到任何没有后缀的资源(这对于通过 apache 在本地浏览非常动态的站点很有用)

-p获取页面加载所需的图片、css和所有资源

所以:

wget --mirror --convert-links --HTML-extension -p http://www.example.com/

最后,如果不是你的网站,那么要有礼貌并添加一个-w(在请求之间等待,以秒为单位)

关于linux - 'wget' 基于框架的完整网站,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4416861/

相关文章:

linux - 在 linux 中添加系统调用时修改 syscall_table.S

Linux 查找脚本结果未附加到输出文本文件

linux - 在 linux 机器上更新 JDK

Python循环下载多个文件

linux - 如何在 sed 中用另一个字符替换单引号?

当尝试使用日语编码调用 wget 时,Python 表现得很奇怪

ssl - CentOS wget 问题

linux - 从 ubuntu 服务器获取文件

linux - 自动下载最新版本的 Slack

python - 如何在 Perl 和 Python 中模拟命令提示符