php - 抓取网站和动态网址

标签 php web seo web-crawler

搜索引擎机器人会抓取我动态生成的 URL 吗?我的意思是 php 基于 url 中的 GET 变量生成的 html 页面。链接看起来像这样:

http://www.mywebsite.com/view.php?name=something
http://www.mywebsite.com/view.php?name=somethingelse
http://www.mywebsite.com/view.php?name=something

我尝试使用此处的测试爬虫来爬取我的网站:http://robhammond.co/tools/seo-crawler但它只访问我的 View 页面一次,标题中只有一个变量。

我网站上的大部分内容都是由数据库中的这些 GET 变量生成的,因此我非常希望搜索引擎能够抓取这些页面。

最佳答案

有些搜索引擎会,有些则不会。 Google for one 确实包含动态生成的页面:https://support.google.com/webmasters/answer/35769?hl=en

请务必检查您的 robots.txt 文件以确保您希望爬虫看到的文件被阻止,而您希望看到的文件em> 想要索引的没有被阻止。

此外,请确保您希望编入索引的所有页面都通过其他页面链接,您有站点地图,或者将单独的 URL 提交给您希望将您的网站编入索引的搜索引擎。

关于php - 抓取网站和动态网址,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28370278/

相关文章:

html - 元描述中 <p> 标签的任何副作用

php - Jquery Onclick 将数据发送到新打开的窗口

php - MySQL查询返回json名称值

php - 保护隐藏表单数据 $_POST

html - 如何将图像放入 Bootstrap 3 div?

seo - 我们需要更改 PRESTASHOP 主题中产品页面的 URL 结构

apache - 检测 Apache 是否正在使用 mod_rewrite

javascript - $_POST with javascript – 它在 javascript 中有效,但在 jquery 插件中无效

html - 如果提交的表单包含验证错误,我是否应该返回 400 错误?

javascript - 干净的 url 在没有标签的前端管理