我正在尝试从以下网站下载所有pdf和ppts:http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides
我在Cygwin中做过:
wget --no-parent -A.pdf,.pptx -r -l1 http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides
但没有文件下载。
我需要在上述wget命令中进行哪些更改才能使其工作?
最佳答案
需要使用-e robots=off
代码,因此可以正常工作
wget -e robots=off -A.pdf,.pptx -r -l1 http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides
通常,也可以使用--debug标志获得更多帮助。
关于WGET从网站下载pdf时出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6416880/