在 GWT 中,我们需要在 URL 中使用 #
来从一个页面导航到另一个页面,即为例如创建历史记录。 www.abc.com/#questions/10245857
但由于这个原因,我在共享 url 时遇到了问题。 Google 抓取器仅读取 #
之前的 url,即 www.abc.com
。
现在我想从我的网址中删除 #
并希望将其保持为 www.abc.com/question/10245857
。
我做不到。我该怎么做?
当用户浏览应用程序时,我使用哈希 url 和历史记录对象(如 不重新加载页面)。然而有时它很好/需要有一个 漂亮的 URL(例如用于共享、公开展示等)所以我想知道如何 提供同一页面的漂亮 URL。
注意:
我们必须这样做才能使我们的网页 url 可抓取并将该网站与外界链接起来。
最佳答案
这里有3个问题,每个都可以解决:
- URL 对用户来说应该更漂亮
- 直接转到漂亮的 URL 应该可行。
- WebCrawlers应该能够获取内容
这些可能看起来都是同一个问题,但在这种情况下它们是截然不同的。
显示漂亮的 URL
可以用一个使用 HTML5 state methods 的小 javascript 文件来完成.可以看一个简单的demo here , 与 source here .这使得对“#”的所有更改都在没有“#”的情况下显示(在现代浏览器上)。
fiddle的相关代码:
var stateObj = {locationHash: hash};
history.replaceState(stateObj, "Page Title", baseURL + hash.substring(1));
响应漂亮的 URL
这相对简单,只要您在 GWT 中有一个监听器即可在页面加载时基于“#”进行加载。您可以抛出一个简单的重定向 servlet,它会在收到请求时将“#”标记重新插入到它所属的位置。
对于 servlet,监听漂亮的 URL:
if(request.getPathInfo()!=null && request.getPathInfo().length()>1){
response.sendRedirect("#" + request.getPathInfo());
return;
}
或者,您可以直接从此 servlet 提供 GWT 应用程序,并使用 URL 中的参数对其进行初始化,但需要注意一些相对路径簿记。
网络爬虫
这是最棘手的一个。基本上你无法绕过这里的静态(ish)页面。如果您正在索引一组有限的简单状态,那并不太难。一个简单的方案是有一个单独的 servlet,它以最小格式的 HTML 返回您通常使用 GWT 获取的原始内容。这个 servlet 可以有不同的 URL 模式,比如“/indexing/”。这些不适用于人类,仅适用于网络爬虫。您可以在
中附加一个简单的 javascript,以便在页面加载后将用户重定向到漂亮的 url。下面是此类 servlet 的 doGet 方法的示例:
response.setContentType("text/html;charset=UTF-8");
response.setStatus(200);
pw = response.getWriter();
pw.println("<html>");
pw.println("<head><script>");
pw.println("window.location.href='http://www.example.com/#"
+ request.getPathInfo() + "';");
pw.println("</script></head>");
pw.println("<body>");
pw.println(getRawPageContent(request.getPathInfo()));
pw.println("</body>");
pw.println("</html>");
pw.flush();
pw.close();
return;
然后,您应该将一些指向这些索引页面的链接隐藏在您的主应用 URL 中的某处(或在您的主应用 URL 上的链接后面)。
关于java - 使 gwt 网站在没有哈希符号的情况下可抓取?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25522085/