url - 从开发的角度来看，indeed.com 的 URL 结构和站点是如何工作的？

在网站管理员的问答网站上，我问了以下问题:

但是，我想从开发的角度了解更多有关此的信息。

如果您在 Google 上搜索任何与工作相关的内容，例如 Gastonia Jobs(City + 工作)，那么，除了他们的搜索结果占据 Google 的第一页之外，您还会得到一个如下所示的 URL 结构:

indeed.com/l-Gastonia,-NC-jobs.html

我假设 L 代表 URL 结构中的位置。如果您搜索与行业相关的工作或具有特定公司名称的工作，您将得到类似以下内容(Microsoft 职位):

indeed.com/q-Microsoft-jobs.html

美国有 40,000 多个城市，我想，好吧，也许他们可以遍历这些城市并为每个城市创建一个页面。这对计算机来说并不难。但很明显，该网站是动态的，因为每个页面都有 10000 条结果，并按 10 分页。上面的 q 显然代表查询。我能理解的位置，但他们不可能为每个查询组合创建网页，对吗？

好吧，这有点奇怪。我想看看他们是否有站点地图，所以我在 Google 中输入“indeed.com sitemap.xml”，得到了回复:

indeed.com/q-Sitemap-xml-jobs.html

.. 我再次搜索“indeed.com url structure”，正如我在另一篇关于网站管理员的帖子中提到的，我得到了回复:

indeed.com/q-change-url-structure-l-Arkansas.html

indeed.com 是否以某种方式使用编程根据我在 google 中的搜索输入动态创建网页？如果不是，他们如何能够为数百万可能的查询组合提供静态页面，让它们动态分页，然后让所有这些都占据谷歌结果的第一页(尽管最后一个问题可能是最好的对于网站管理员 QA)？

页面中的 javascript 是否以某种方式与 URL 交互

最佳答案

它很可能不是一堆页面。 “实际”页面可能是 http://indeed.com/?referrer=google&searchterm=jobs%20in%20washington .该网站然后巧妙地使用 URL 重写生成一个人类可读的 URL，在数据库中获取与查询匹配的工作，瞧...

当然，我可能完全错了。说实话，它的技术方面可能可以通过多种方式解决。每次将工作添加到网站时，可能会创建所有需要完成以匹配该工作的页面，从而产生大量页面供 Google 抓取。

关于url - 从开发的角度来看，indeed.com 的 URL 结构和站点是如何工作的？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14545775/