php - 我可以使用 Ruby On Rails 抓取 URL 的源代码,还是应该使用 PHP?

标签 php javascript jquery ruby-on-rails

Possible Duplicate:
How do I write a web scraper in Ruby?

我需要抓取我的应用程序数据库中列出的许多网站的源代码。我正在检查他们是否链接回我的网站。

是否可以使用 Ruby on Rails,还是应该使用 PHP?

最佳答案

您可以获取网站列表,然后对每个网站运行 curl

编辑:或者,你可以尝试这个很棒的lib,简单的dom解析器(http://simplehtmldom.sourceforge.net):

<?php

require 'simple_html_dom.php';

define(MYWEBSITE, "google.com");
$html = file_get_html('http://www.google.com/');

foreach($html->find('a') as $link) {
  $url =  $link->href;
  if (!strpos($url, MYWEBSITE)) {
    // Do whatever you need to do here, we'll just simply echo out
    // the website URL that has your site URL in it.
    echo $url . " contains " . MYWEBSITE ."\n";
  }
}

?>

只是一个简单的技巧,但它可以完成工作。

关于php - 我可以使用 Ruby On Rails 抓取 URL 的源代码,还是应该使用 PHP?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12047944/

相关文章:

php - 无法获取未序列化的数据

php - mysql不通过php将长字符串插入数据库

javascript - 不在 view/html Angular 中显示对象

jquery - 仅隐藏触发的元素,而其他元素具有相同的类

php - 将 JavaScript 变量传递给 PHP session

php - 如何在具有基本主题的 Moodle 2.6 中通过 https 获取背景图像?

javascript - Jest 单元测试 - SyntaxError : Cannot use import statement outside a module

javascript - 打字时改变单词的颜色

jquery - 页面上每个图像的随机最大宽度

jquery - 我应该在哪里放置jquery来触发rails中的点击事件?