apache - 如何阻止垃圾邮件机器人使用 htaccess 访问网站?

标签 apache .htaccess

我有一个运行 WordPress 的 apache 服务器,最近我注意到来自垃圾邮件机器人的大量流量,更具体地说是 bot-traffic.xyz,在查看 Google Analytics 时,它显示在“热门推荐”部分中。我的问题是,由于我不知道源 IP 地址,如何使用 .htaccess 阻止垃圾邮件机器人? 我找到了一篇帖子 ( https://moz.com/blog/how-to-stop-spam-bots-from-ruining-your-analytics-referral-data ) 指出了这个过程,但我不确定,因为它是 2015 年的。 该帖子说要做这样的事情:

RewriteEngine on
RewriteCond %{HTTP_REFERER} ^http://.*domain1\.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*domain2\.com/ [NC]
RewriteRule ^(.*)$ – [F,L]

如果这是正确的,我将如何阻止 bot-traffic.xyz? 有人能描述一下上面的代码是什么吗?

谢谢

最佳答案

这些机器人根本不会访问您的网站,而是使用您的 Google Universal Analytics (UA) 代码并直接访问 Google 并将其网站 URL 推送到页面变量中。添加重写规则不会有帮助。检查您的 Apache 日志文件,您不会发现任何流量。

这些网址都会返回到由出售虚假流量作为服务的人运营的同一个网站。您可以尝试在 Google Analytics 中设置过滤器,但这将是一场怪人游戏。摆脱这个问题的最佳方法是在 Google Analytics Universal 中设置 View 过滤器。管理图标(左下角)-> 过滤器(在最右边的列中)。添加过滤器。选择自定义过滤器,从请求 URL 中排除。然后构建正则表达式来删除有问题的网站。

关于apache - 如何阻止垃圾邮件机器人使用 htaccess 访问网站?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65801729/

相关文章:

java - 有人可以解释 ivy.xml 依赖项的 conf 属性吗?

apache - 配置 Google 负载均衡器主机和路径规则,以便使用 GCF 正确地为 React.js 应用程序提供服务

apache - Oauth2 登录在 AWS 上超时

apache - 如何在 .htaccess 中阻止对以/trackback/结尾的 URL 的 POST 请求?

php - 非常先进的.htaccess

java - Tomcat 7 停止接收 HTTP 请求

php - 解决 PHP 中缺少 "Authorization"请求 header 的问题

php - 链接正确时未找到样式表

php - Laravel 项目旁边的 Wordpress 项目(在 public_html 文件夹中)

.htaccess - 如何在共享主机上部署 Symfony2?