seo - 禁止 robots.txt 中的目录时是否应该使用尾部斜杠?

标签 seo robots.txt trailing-slash

我想禁止抓取 robots.txt 中的目录 /acct 我应该使用哪个规则?

禁止:/acct禁止:/acct/

acct 包含子目录和文件。尾部斜杠有什么作用?

最佳答案

由于 robots.txt 规则都是“开头为”规则,因此您提议的两条规则都不允许以下内容:

  • https://example.com/acct/
  • https://example.com/acct/foo
  • https://example.com/acct/bar

但是,只有没有尾部斜杠的规则才会不允许以下内容:

  • https://example.com/acct
  • https://example.com/acct.html
  • https://example.com/acctbar

Disallow:/acct/ 通常更好,因为不存在禁止意外 URL 的风险。但是,它不会阻止抓取 /acct

在大多数情况下,Web 服务器会重定向不带尾部斜杠的目录 URL 以添加尾部斜杠。在您的服务器上,https://example.com/acct 可能会重定向到 https://example.com/acct/。如果是这种情况,通常可以允许机器人抓取不带尾部斜杠的 /acct 并查看重定向。他们将被阻止抓取重定向的目标。

关于seo - 禁止 robots.txt 中的目录时是否应该使用尾部斜杠?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72105880/

相关文章:

javascript - 检索到相同数据时,浏览器中的 AJAX 获取请求(js)和 "normal"访问是否有所区别?

seo - .tk 域名的排名是否低于高级顶级域名?

seo - 哪个更好 : meta-refresh-url-redirect or htaccess 301 redirect?

google-chrome - 用于检测 Google Chrome 预加载请求的 HTTP header

amazon-s3 - 将名称包含尾部斜杠的文件上传到 AWS S3 存储桶

javascript - 您可以将属性添加到通过 json - ld 标记的现有微数据模式吗?

html - 指向本地站点地图的 robotext 文件

seo - Robots.txt 被正则表达式禁止

MySQL REGEXP 在正斜杠后带有字边界

reactjs - 使用 React 和 Flask API 的尾部斜线的 CORS 奇怪行为