wordpress - 如何阻止过度访问我的网站的机器人?

标签 wordpress .htaccess web-crawler bots

此机器人不尊重 robots.txt 中的 nofollow noindex

我在 robots.txt 中有这个:

User-agent: Msnbot
Disallow: /

User-Agent: Msnbot/2.0b
Disallow: /

到目前为止,速度相当慢,但现在,它是一个根本不会离开我的网站的怪物。 24/7 抓取所有 WordPress 和 MyBB。

要阻止 IP 范围,或者我可以采取什么措施来阻止所有这些内容窃取者?

最佳答案

基于Block by useragent or empty referer你可以在 .htaccess 中添加类似的内容

Options +FollowSymlinks  
RewriteEngine On  
RewriteBase /  
SetEnvIfNoCase User-Agent "^Msnbot" ban_agent
Deny from env=ban_agent

关于wordpress - 如何阻止过度访问我的网站的机器人?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22128434/

相关文章:

regex - Wordpress 子目录上的不同项目

php - 在 2 个 WordPress 上共享用户安装在同一服务器上的 2 个子域中

javascript - 使用 jQuery 用链接包装幻灯片(Wordpress Revolution Slider 插件)

javascript - 启用js重定向到apache服务器的私有(private)文件夹

php - 如何阻止 Alexa 工具栏用户?

.htaccess - 为什么 google 会找到被 robots.txt 排除的页面?

java - 为什么我的爬网程序获取错误的 HTML 代码?

php - 建立数据库连接时出错 - WP 主机更改了密码

.htaccess - 向现有 .htaccess 添加选项

ruby - 无法使用 ruby​​ mechanize 登录 Pinterest