meta - 多个机器人元标记

我最近继承了一个代码库并发现了这个 gem :

{% if PAGE_EXTRAS.hide_from_sitemap %}
    <META NAME="ROBOTS" CONTENT="NOINDEX, FOLLOW">
    <META NAME="ROBOTS" CONTENT="INDEX, NOFOLLOW">
    <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
{% endif %}

我不知道它要做什么。您是否有理由在这样的站点中放置多个明显冲突的机器人标签？或者它是否像我不知情的人所看到的那样疯狂？

最佳答案

这对我来说是个错误。我能找到的唯一信息是 Google's Robots meta tag specification :

If competing directives are encountered by our crawlers we will use the most restrictive directive we find.

因此，(至少对于 Google)代码:

<meta name="robots" content="noindex, follow">
<meta name="robots" content="index, nofollow">
<meta name="robots" content="noindex, nofollow">

与以下内容完全相同:

<meta name="robots" content="noindex, nofollow">

可以想象这段代码可能是作为某种偷偷摸摸的黑客，旨在通过利用它们解决冲突的方式的差异，将不同的规则应用于不同的爬虫。如果是这样，恕我直言，这是一个糟糕的主意。当已经有一个合法的机制来做同样的事情时，就不需要凌乱的脆弱的黑客:

<meta name="googlebot" content="noindex, follow">
<meta name="bingbot" content="index, nofollow">

关于meta - 多个机器人元标记，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45078949/

上一篇：SonarQube - 如何检测项目之间代码的复制粘贴？

下一篇：java - 如何将 Java 静态方法导入 Drools 文件？

javascript - 智能应用横幅关闭事件

javascript - 添加 <meta name ="viewport"> 并进行移动检测

search - 处理几乎没有搜索信息的默认网页？

seo - 如何配置 robots.txt 文件以阻止除 2 个目录之外的所有目录

seo - Googlebot 无法加载页面资源

linux - robots.txt - 禁止没有查询字符串的页面

javascript - 如何检索资源的 og/meta 属性？

SPA 模式下的 AngularJS 和元标记？

seo - 当我只有一个根文件夹时，如何为 TYPO3 多域系统实现站点地图？