java - 使 gwt 网站在没有哈希符号的情况下可抓取?

标签 java gwt url-routing

在 GWT 中,我们需要在 URL 中使用 # 来从一个页面导航到另一个页面,即为例如创建历史记录。 www.abc.com/#questions/10245857 但由于这个原因,我在共享 url 时遇到了问题。 Google 抓取器仅读取 # 之前的 url,即 www.abc.com

现在我想从我的网址中删除 # 并希望将其保持为 www.abc.com/question/10245857

我做不到。我该怎么做?

当用户浏览应用程序时,我使用哈希 url 和历史记录对象(如 不重新加载页面)。然而有时它很好/需要有一个 漂亮的 URL(例如用于共享、公开展示等)所以我想知道如何 提供同一页面的漂亮 URL。

注意:
我们必须这样做才能使我们的网页 url 可抓取并将该网站与外界链接起来。

最佳答案

这里有3个问题,每个都可以解决:

  1. URL 对用户来说应该更漂亮
  2. 直接转到漂亮的 URL 应该可行。
  3. WebCrawlers应该能够获取内容

这些可能看起来都是同一个问题,但在这种情况下它们是截然不同的。

显示漂亮的 URL

可以用一个使用 HTML5 state methods 的小 javascript 文件来完成.可以看一个简单的demo here , 与 source here .这使得对“#”的所有更改都在没有“#”的情况下显示(在现代浏览器上)。

fiddle的相关代码:

var stateObj = {locationHash: hash};
history.replaceState(stateObj, "Page Title", baseURL + hash.substring(1));

响应漂亮的 URL

这相对简单,只要您在 GWT 中有一个监听器即可在页面加载时基于“#”进行加载。您可以抛出一个简单的重定向 servlet,它会在收到请求时将“#”标记重新插入到它所属的位置。

对于 servlet,监听漂亮的 URL:

if(request.getPathInfo()!=null && request.getPathInfo().length()>1){
    response.sendRedirect("#" + request.getPathInfo());
    return;
}

或者,您可以直接从此 servlet 提供 GWT 应用程序,并使用 URL 中的参数对其进行初始化,但需要注意一些相对路径簿记。

网络爬虫

这是最棘手的一个。基本上你无法绕过这里的静态(ish)页面。如果您正在索引一组有限的简单状态,那并不太难。一个简单的方案是有一个单独的 servlet,它以最小格式的 HTML 返回您通常使用 GWT 获取的原始内容。这个 servlet 可以有不同的 URL 模式,比如“/indexing/”。这些不适用于人类,仅适用于网络爬虫。您可以在 中附加一个简单的 javascript,以便在页面加载后将用户重定向到漂亮的 url。

下面是此类 servlet 的 doGet 方法的示例:

response.setContentType("text/html;charset=UTF-8");
response.setStatus(200);
pw = response.getWriter();
pw.println("<html>");
pw.println("<head><script>");
pw.println("window.location.href='http://www.example.com/#"
        + request.getPathInfo() + "';");
pw.println("</script></head>");
pw.println("<body>");
pw.println(getRawPageContent(request.getPathInfo()));
pw.println("</body>");
pw.println("</html>");
pw.flush();
pw.close();
return;

然后,您应该将一些指向这些索引页面的链接隐藏在您的主应用 URL 中的某处(或在您的主应用 URL 上的链接后面)。

关于java - 使 gwt 网站在没有哈希符号的情况下可抓取?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25522085/

相关文章:

java - 如何在不使用 system.exit() 的情况下,在输入 "quit"时使用一段时间不断要求用户输入并退出程序?

java - a = b 和 b = a 之间的区别?

gwt-query - 嵌套可拖动传播

java - 使用 ListDataProvider 填充 CellTree

javascript - 如何向实际的 post 请求添加额外的 req.body 属性,然后以 Express 方式重定向它

.net - ASMX 操作 404s,但 ASMX 服务描述没有,url 路由问题?

java - 将iso8601字符串日期时间格式转换为Java中的日期

java - JOptionPane按钮排列

java - 在 GWT 中,如果按下 Shift 按钮,如何从树中的 SelectionEvent 知道

java - 替换 web.xml 和 Spring MVC 中的 <servlet-mapping>