php - 是否有适用于PHP或Ruby的网络搜寻器库?

标签 php ruby web-crawler

是否有一个可用于php或ruby的web爬虫程序库?一个能做到深度优先或广度优先的图书馆…并处理链接,即使使用了ref=“../relative\u path.html”和基url。

最佳答案

查看此页面以获取Ruby库:Ruby Mechanize
我想说的是,你仍然要对你的爬虫穿越网站的方式负责。

关于php - 是否有适用于PHP或Ruby的网络搜寻器库? ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/855873/

相关文章:

ruby - Ruby SDK 版本 2 中的响应分页是什么?

asp.net - Htmlagilitypack 获取外部元素

web-crawler - 用于抓取和挖掘网站数据的最佳开源库或应用程序

php - 是什么导致查询排除第一条记录

php 's mysql_query function didn' 支持更多LIKE语句吗?

php - 为我的情况分页?

php - Nginx + php fastcgi 无法打开文件,权限被拒绝

ruby-on-rails - Gem::LoadError:为数据库适配器指定了 'postgresql',但未加载 gem

html - 将默认值设置为 html 中的空白表单。(Ruby、Sinatra、CSS)

html - Google 未列出网站,但没有错误且内容显得丰富