linux - 如何使用wget递归地获取一些带有模式的数据

标签 linux wget

我正在尝试从此网站 ( http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/ ) 下载一些特定文件，它们保留 10 天的数据。我想从所有以“nam_pcpn_anal”开头的目录下载以“ST4”开头的所有文件。我可以从一个文件夹中下载所有以“ST4”开头的文件，例如:

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ -A ST4* 'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/nam_pcpn_anal.20160625/'

但我不知道如何递归搜索 ST4。我认为以下应该可行，但不行!

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ -A ST4* --accept nam_pcpn_anal*/ST4* 'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/'

任何想法!

最佳答案

wget manual显示:

   -I list
   --include-directories=list
       Specify a comma-separated list of directories you wish to follow
       when downloading.  Elements of list may contain wildcards.

所以，你可以试试:

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ \
    -A 'ST4*' -I '*/nam_pcpn_anal.*' \
    'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/'

关于linux - 如何使用wget递归地获取一些带有模式的数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38213804/

上一篇：php - Linux:为 Monkey 服务器设置 PHP FastCGI

下一篇：linux - 从 glusterfs 缓存中删除文件(硬链接(hard link))

c - Linux内核有getc、putc、seek等简单的C文件操作函数吗？

linux - 删除目录中超过 1 天的所有文件

c++ - 如何检查文件是否为 DLL？

http - 登录命令行后执行GET请求

linux - 如何使用wget删除远程删除的文件

linux - SSH 不在 sudo 之后运行命令

来自 Google 文档的 wget 上的 SSL 证书错误

windows - 并行运行带有循环变量的命令，最多同时运行 N 个