我有我的博客(如果你想看,可以从我的个人资料中看到),而且很新鲜,还有谷歌机器人解析结果。
结果令我震惊。显然,我网站上最常见的两个词是“rss”和“feed”,因为我使用文本作为链接,例如“评论 RSS”、“帖子订阅”等。这两个词将出现在每篇文章中,而其他词会更稀有。
有没有办法让这些链接从 Google 的解析中消失?我不希望技术链接被编入索引。我只希望内容、标题、描述被编入索引。除了用图像替换此文本之外,我正在寻找其他内容。
我在 Google 上发现了一些 2007 年的旧讨论(我认为在 3 年内很多事情可能会发生变化,希望这也是)
这个问题与 robots.txt 以及如何让 Google 忽略页面无关。它是关于让它忽略页面的小部分,或者以人类可以看到但机器人不可见的方式转换这些部分。
有一种简单的方法可以告诉谷歌不要索引您文档的某些部分,那就是使用 googleon
和 googleoff
:
<p>This is normal (X)HTML content that will be indexed by Google.</p>
<!--googleoff: index-->
<p>This (X)HTML content will NOT be indexed by Google.</p>
<!--googleon: index-->
在这个例子中,第二段不会被谷歌索引。请注意“index
”参数,它可以设置为以下任何一项:
index
— 被“googleoff: index
”包围的内容将不会被编入索引
由谷歌
anchor
— “googleoff: anchor
”区域内任何链接的 anchor 文本
不会与目标页面相关联
snippet
— 不会使用被“googleoff: snippet
”包围的内容
为搜索结果创建片段
all
— 被“googleoff: all
”包围的内容被视为 all
source