在网站管理员的问答网站上,我问了以下问题:
但是,我想从开发的角度了解更多有关此的信息。
如果您在 Google 上搜索任何与工作相关的内容,例如 Gastonia Jobs(City + 工作),那么,除了他们的搜索结果占据 Google 的第一页之外,您还会得到一个如下所示的 URL 结构:
indeed.com/l-Gastonia,-NC-jobs.html
我假设 L 代表 URL 结构中的位置。如果您搜索与行业相关的工作或具有特定公司名称的工作,您将得到类似以下内容(Microsoft 职位):
indeed.com/q-Microsoft-jobs.html
美国有 40,000 多个城市,我想,好吧,也许他们可以遍历这些城市并为每个城市创建一个页面。这对计算机来说并不难。但很明显,该网站是动态的,因为每个页面都有 10000 条结果,并按 10 分页。上面的 q 显然代表查询。我能理解的位置,但他们不可能为每个查询组合创建网页,对吗?
好吧,这有点奇怪。我想看看他们是否有站点地图,所以我在 Google 中输入“indeed.com sitemap.xml”,得到了回复:
indeed.com/q-Sitemap-xml-jobs.html
.. 我再次搜索“indeed.com url structure”,正如我在另一篇关于网站管理员的帖子中提到的,我得到了回复:
indeed.com/q-change-url-structure-l-Arkansas.html
indeed.com 是否以某种方式使用编程根据我在 google 中的搜索输入动态创建网页?如果不是,他们如何能够为数百万可能的查询组合提供静态页面,让它们动态分页,然后让所有这些都占据谷歌结果的第一页(尽管最后一个问题可能是最好的对于网站管理员 QA)?
页面中的 javascript 是否以某种方式与 URL 交互
最佳答案
它很可能不是一堆页面。 “实际”页面可能是 http://indeed.com/?referrer=google&searchterm=jobs%20in%20washington .该网站然后巧妙地使用 URL 重写生成一个人类可读的 URL,在数据库中获取与查询匹配的工作,瞧...
当然,我可能完全错了。说实话,它的技术方面可能可以通过多种方式解决。每次将工作添加到网站时,可能会创建所有需要完成以匹配该工作的页面,从而产生大量页面供 Google 抓取。
关于url - 从开发的角度来看,indeed.com 的 URL 结构和站点是如何工作的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14545775/