对于一个网站,我的站点地图索引文件和我所有的站点地图都被 gzip 压缩并具有如下名称(SiteMapIndex.xml.gz、SiteMap1.xml.gz、SiteMap2.xml.gz),robots.txt 应该文件和 SiteMapIndex.xml 文件引用了 gzip 文件名或非 gzip 文件名?
例子 - robots.txt 的内容应该是这样的吗? -
Sitemap: http://www.mysite.com/SiteMapIndex.xml.gz
或者像这样(没有 .gz)?
Sitemap: http://www.mysite.com/SiteMapIndex.xml
SiteMapIndex.xml 的内容应该是这样的吗? -
...
<sitemap>
<loc>http://www.mysite.com/SiteMap1.xml.gz</loc>
<lastmod>2013-08-20</lastmod>
</sitemap>
<sitemap>
<loc>http://www.mysite.com/SiteMap2.xml.gz</loc>
<lastmod>2013-08-20</lastmod>
</sitemap>
...
还是这个(没有 .gz)? -
...
<sitemap>
<loc>http://www.mysite.com/SiteMap1.xml</loc>
<lastmod>2013-08-20</lastmod>
</sitemap>
<sitemap>
<loc>http://www.mysite.com/SiteMap2.xml</loc>
<lastmod>2013-08-20</lastmod>
</sitemap>
...
最佳答案
如果您希望机器人读取 .gz 文件,请将 .gz 名称放入索引中。即:
<sitemap>
<loc>http://www.mysite.com/SiteMap1.xml.gz</loc>
<lastmod>2013-08-20</lastmod>
</sitemap>
<sitemap>
<loc>http://www.mysite.com/SiteMap2.xml.gz</loc>
<lastmod>2013-08-20</lastmod>
</sitemap>
参见 Using Sitemap Index Files .
您的 robots.txt 文件也是如此:输入 gzip 文件的名称。
关于search-engine - 站点地图索引和 robots.txt 引用 .gz 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18340992/