所以我正在尝试创建一个别名/脚本以使用 wget 从网站/目录下载所有特定扩展,但我觉得一定有比我想出的更简单的方法。
现在我通过搜索 Google 和手册页得到的代码是:
wget -r -l1 -nH --cut-dirs=2 --no-parent -A.tar.gz --no-directories http://download.openvz.org/template/precreated/
所以在上面的例子中,我试图从 OpenVZ 预先创建的模板目录下载所有的 .tar.gz 文件。
上面的代码工作正常,但我必须手动指定 --cut-dirs=2 这将删除通常会创建的/template/precreated/目录结构,它还会下载 robots.txt 文件。
现在这不一定是个问题,只删除 robots.txt 文件很容易,但我希望我只是错过了手册页中的一些内容,这些内容允许我在不指定要剪切的目录结构的情况下执行相同的操作出...
提前感谢您的帮助,非常感谢!
最佳答案
使用-R
选项
-R robots.txt,unwanted-file.txt
作为您不想要的文件的拒绝列表(以逗号分隔)。
至于编写脚本:
URL=http://download.openvz.org/template/precreated/
CUTS=`echo ${URL#http://} | awk -F '/' '{print NF -2}'`
wget -r -l1 -nH --cut-dirs=${CUTS} --no-parent -A.tar.gz --no-directories -R robots.txt ${URL}
这应该基于您 URL 中的子目录。
关于linux - 使用 WGET 从网站/目录下载所有 .tar.gz 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14489889/