linux - 'wget' 基于框架的完整网站

标签 linux wget

我有个小问题。我要递归下载 that web page ，但它基于“框架”。标准方法帮不了我。我尝试了不同的变体，但没有。我最多可以下载一个递归，我找到了例子 there .我怎样才能完全捕获那个网站，而不是离线使用它？谢谢。

最佳答案

如果您想要站点的本地副本，请使用 --mirror:

wget --mirror http://www.example.com/

其他一些选项也很有用:

--convert-links 将绝对链接转换为本地链接，以便您可以在本地浏览网站。

--HTML-extension 将 .html 添加到任何没有后缀的资源(这对于通过 apache 在本地浏览非常动态的站点很有用)

-p获取页面加载所需的图片、css和所有资源

所以:

wget --mirror --convert-links --HTML-extension -p http://www.example.com/

最后，如果不是你的网站，那么要有礼貌并添加一个-w(在请求之间等待，以秒为单位)

关于linux - 'wget' 基于框架的完整网站，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4416861/

上一篇：php - 我如何告诉 Apache2，默认运行 mod_php5，但在 CGI 模式下运行此 VH？

下一篇：php - 对于 PHP 可以写入的文件夹，Linux 上的最佳用户/权限设置是什么？

相关文章：

linux - 在 linux 中添加系统调用时修改 syscall_table.S

Linux 查找脚本结果未附加到输出文本文件

linux - 在 linux 机器上更新 JDK

Python循环下载多个文件

linux - 如何在 sed 中用另一个字符替换单引号？

当尝试使用日语编码调用 wget 时，Python 表现得很奇怪

ssl - CentOS wget 问题

linux - 从 ubuntu 服务器获取文件

linux - 自动下载最新版本的 Slack

python - 如何在 Perl 和 Python 中模拟命令提示符

©2024 IT工具网联系我们