php - 抓取网站和动态网址

搜索引擎机器人会抓取我动态生成的 URL 吗？我的意思是 php 基于 url 中的 GET 变量生成的 html 页面。链接看起来像这样:

http://www.mywebsite.com/view.php?name=something
http://www.mywebsite.com/view.php?name=somethingelse
http://www.mywebsite.com/view.php?name=something

我尝试使用此处的测试爬虫来爬取我的网站:http://robhammond.co/tools/seo-crawler但它只访问我的 View 页面一次，标题中只有一个变量。

我网站上的大部分内容都是由数据库中的这些 GET 变量生成的，因此我非常希望搜索引擎能够抓取这些页面。

最佳答案

有些搜索引擎会，有些则不会。 Google for one 确实包含动态生成的页面:https://support.google.com/webmasters/answer/35769?hl=en

请务必检查您的 robots.txt 文件以确保您不希望爬虫看到的文件被阻止，而您希望看到的文件em> 想要索引的没有被阻止。

此外，请确保您希望编入索引的所有页面都通过其他页面链接，您有站点地图，或者将单独的 URL 提交给您希望将您的网站编入索引的搜索引擎。

关于php - 抓取网站和动态网址，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28370278/

上一篇：javascript - 按照 Google 的建议优化 CSS 交付

下一篇：html - 我应该在引用网站中使用 nofollow 链接吗？

相关文章：

html - 元描述中 <p> 标签的任何副作用

php - Jquery Onclick 将数据发送到新打开的窗口

php - MySQL查询返回json名称值

php - 保护隐藏表单数据 $_POST

html - 如何将图像放入 Bootstrap 3 div？

seo - 我们需要更改 PRESTASHOP 主题中产品页面的 URL 结构

apache - 检测 Apache 是否正在使用 mod_rewrite

javascript - $_POST with javascript – 它在 javascript 中有效，但在 jquery 插件中无效

html - 如果提交的表单包含验证错误，我是否应该返回 400 错误？

javascript - 干净的 url 在没有标签的前端管理