recursion - 如何在特定 TLD 上递归 wget?

标签 recursion dns wget tld

是否可以使用 wget 从特定 TLD 递归下载文件?

具体来说,我正在尝试下载 Code of Massachusetts Regulations 的全文。法规的实际文本存储在跨多个域的多个文件中,因此我想从 index page 开始递归下载。 ,但仅关注 .gov 和 .us 域的链接。

最佳答案

wget documentation on spanning hosts 的帮助下,我能够使用 -H 和 -D 标志来完成这项工作:

wget -r -l5 -H -D.us,.gov http://www.lawlib.state.ma.us/source/mass/cmr/index.html

关于recursion - 如何在特定 TLD 上递归 wget?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10503147/

相关文章:

python - 如何找到整数 1,2,3 加起来等于 n 的方式数?

recursion - "Overflow evaluating the requirement"是什么意思,我该如何解决?

recursion - 二叉树 - 计算级别上的节点

ssl - CAA记录支持在哪个服务器上

linux - 在 bash 脚本中编码字符串的 URL

compilation - 使用静态链接编译 wget,自编译(开放)ssl 库链接问题

javascript - 对这个简单的递归函数如何工作感到非常困惑 - 如何解释它?

linux - Centos需要很长时间才能解析本地网络附近的服务器

apache - 虚拟主机 DocumentRoot 未更改

linux - shell 脚本 wget 在用作 cron 作业时不起作用