linux - 如何使用 wget linux 命令镜像维基百科页面?

标签 linux web command-line wget mirror

<分区>

我想用 wget Linux 命令镜像维基百科页面 我用了这个命令

wget --mirror -p --convert-links -P ./folder-mirror /https://en.wikipedia.org/wiki/Portal:Contents/A–Z_index

但我只得到这个文件 机器人.txt

最佳答案

不要那样做。它会给维基百科网络服务器带来巨大负载,您的 IP 将被阻止。

如果您想要维基百科的镜像,请从 https://dumps.wikimedia.org/ 下载其数据库的转储。 .截至目前,英文 wiki 的最新完整转储可在以下位置获得:

https://dumps.wikimedia.org/enwiki/20160407/

如果您只需要来自特定页面的数据,请考虑使用 the MediaWiki API .

关于linux - 如何使用 wget linux 命令镜像维基百科页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37035117/

相关文章:

linux - Ubuntu 通过 GID 删除组

Python3 pip3 无法安装requests

php - MySQL 错误代码 1054 ......需要帮助的新手

xcode - 了解要传递给编译器的标志

c - 自动为执行的程序提供输入

linux - 为什么 puppet 资源在指定提供者时表现不同

c - 放弃(root)特权后,fork()ing 是否有任何安全优势?

trello - Trello webhook 问题

javascript - 为什么在使用 "Grid"的 'semantic-ui-react' 组件时得到不正确的布局?

ios - 如何从命令行构建 iOS App Store 发布文件?