html - 如何在 robots.txt 中只允许一个代理?

标签 html .htaccess adsense robots.txt google-crawlers

我目前在我的 robots.txt 中使用以下代码来禁止任何爬虫访问我的网站。但我只想有一个异常(exception),那就是 Google AdSense 的抓取工具。
这是我的代码:User-agent: * Disallow: /Google 的 AdSense 抓取工具名为“Mediapartners-Google”。
如何将其添加为异常(exception),并继续阻止所有其他爬虫?
谢谢,伙计们!

最佳答案

这可能是您正在寻找的内容:

User-agent: Mediapartners-Google Disallow:

User-agent: * Disallow: /
并不是需要条目之间的分隔空行。

不能保证所有机器人都遵守这些规则。机器人在自愿的基础上遵守这些规则。所以“邪恶的”机器人很可能不会在意......

关于html - 如何在 robots.txt 中只允许一个代理?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67580883/

相关文章:

javascript - 在 Question2Answer 中特定帖子的第 n 段后添加 javascript

javascript - 如何在 react js 中嵌入 google adsense

adsense - Google AMP AutoAds - 未找到广告展示位置

javascript - Bootstrap 选择输入区域大于父区域

php - 将 .htaccess 内容与 PHP 中的正则表达式进行匹配

javascript - 在我的 SPA 中的何处添加 JQuery 多选脚本?

apache - Web 服务器不断重定向到 HTTP

xml - SVG 图像文件显示 XML 代码而不是图像

javascript - 立即淡出音频

html - 如何为 ng-repeat 元素提供不同的填充样式?