seo - 为什么 Google robots.txt Tester 有错误且无效

如下图所示 Google WebMaster Tools robots.txt Tester 告诉我 9 个错误，但我不知道如何解决它，问题是什么？

请帮我弄清楚

最佳答案

这是一个有效的 robots.txt - 但你有一个 UTF-8 BOM (\xef\xbb\xbf)在文本文件的开头。这就是为什么第一行的“用户”旁边有一个红点。这个标记告诉浏览器和文本编辑器将文件解释为 UTF-8，而 robots.txt 应该只使用 ASCII 字符。

将您的文本文件转换为 ASCII，错误就会消失。或者复制红点后的所有内容，然后再次尝试粘贴。

我在在线版本上测试了这个，这是从字节形式翻译的结果:

\xef\xbb\xbfUser-agent: *\r\nDisallow: /en/news/iranology/\r\nDisallow:
 /en/tours-services/tour-the-soul-of-iran\r\nDisallow: 
/en/tours-services/tour-a-whistle-stop-tour\r\nDisallow: /en/to

一开始就可以清楚的看到BOM。浏览器和文本编辑器会忽略它，但它可能会干扰爬虫解析 robots.txt 的能力。您可以使用此 python 脚本测试实时版本:

import urllib.request

text = urllib.request.urlopen('http://www.best-iran-trip.com/robots.txt')

print(repr(text.read()))

如果您能够安装 Notepad++ , 它实际上有一个编码菜单，可以让你以任何格式保存它。

关于seo - 为什么 Google robots.txt Tester 有错误且无效，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39114878/

上一篇：xml - Google 图片搜索中的图片链接到 sitemap.xml

下一篇：seo - schema.org 中的名称属性是什么？

相关文章：

WordPress SEO 删除 SEO 标题末尾的 "-"

asp.net - MVC.NET 4 中的 Robots.txt 文件

java - 使用jsoup逐行读取robot.txt

seo - 如何在不获取 "application/ld+json"的情况下在 Google 搜索 "Missing product ID (optional)"脚本中指定产品 ID

google-search-console - 以 Google 方式获取 - Googlebot(桌面)无法正确呈现页面

seo - 我是否需要为 AMP 页面提交单独的(移动)站点地图？

seo - 谷歌网站管理员网站性能评估的问题

html - 像 domain.com/index.html 这样的 url 是从哪里来的以及如何修复 404s

ruby-on-rails - Rails heroku 应用程序上的 Robots.txt 文件未更新

javascript - 做像 Twitter、Hash-Bang 之类的链接 #!网址