WGET从网站下载pdf时出现问题

标签 wget

我正在尝试从以下网站下载所有pdf和ppts:http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides

我在Cygwin中做过:
wget --no-parent -A.pdf,.pptx -r -l1 http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides
但没有文件下载。

我需要在上述wget命令中进行哪些更改才能使其工作?

最佳答案

需要使用-e robots=off代码,因此可以正常工作
wget -e robots=off -A.pdf,.pptx -r -l1 http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides
通常,也可以使用--debug标志获得更多帮助。

关于WGET从网站下载pdf时出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6416880/

相关文章:

ubuntu - wget时间测量

linux - wget .listing 文件,有没有办法指定它的名称

wget下载并重命名最初没有文件扩展名的文件

linux - 每隔固定时间显示 wget 统计信息

docker - 如何使用 wget 而不是 curl 进行 Docker 健康检查?

python - 网页抓取: press javascript button

shell - 可以在 shell 脚本中对变量进行 urlencode 吗?

windows - .bat 如何检查curl 或wget 是否存在

linux - 在 Linux 上使用 wget 扫描特定文件的子文件夹

unix - 通过wget从Dropbox链接下载包含子文件夹的文件夹到Unix服务器