我有一个纯基于 GWT 的网站,我们知道搜索引擎无法索引纯基于 GWT 的网站。因此,我创建了一个备用网页,如下所示,它作为单独的 html 存储在 war 文件夹中。此网页的目的是征集和索引有关我的网站的详细信息。此页面从未显示在我的网站上,而是仅用于索引。指向此网页的 url 是 Sitemaps.xml 的一部分。因此,我假设以下 html 将被编入索引,因为它是站点地图的一部分。所以这是我的问题:
我在 ID 为“crawler”的 div 中提供的内容是否会被编入索引,因为它计划在加载时删除并且浏览器在加载时被重定向到另一个 url?
有没有更好的方法来为没有任何基于 html 的用户界面的纯 GWT 网站编制内容索引?
我还可以拥有将调用 servlet 并返回用于编制索引的响应的 url。但是搜索结果中会显示相同的 url,这是没有用的。换句话说,我正在尝试找出一种将内容编入索引的方法,但是当用户单击搜索结果时,他应该被重定向到主页而不是显示编入索引的内容。
<head>
<script>
function load(){
element = document.getElementById("crawler");
element.parentNode.removeChild(element);
window.location.href='http://<mysite>.com';
}
</script>
</head>
<body onLoad='load()'>
<div id="crawler">
<CONTENT TO BE INDEXED>......
</div>
</body>
正如您在此处看到的,包含用于索引的所有内容的 div(爬虫)在主体加载后立即被删除。除此之外,该页面还会重定向到加载时网站的主页。
最佳答案
爬虫将读取页面的全部内容以进行索引,因此它可以毫不费力地提取 div 中的部分。在读取页面之前,爬虫不会执行 onload。
我过去使用的一种方法是生成页面的静态 html 版本并通过 sitemap.xml 引用它们。登陆 html 页面的用户在单击链接(即:购买或规范)时将被定向到等效的动态页面。这对于搜索引擎排名非常有效,许多页面出现在前十名中。
关于gwt - 索引重定向 onload 的 HTML 页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16593697/