php - 如何获取特定站点内的所有页面链接?

标签 php web-crawler

我想用 php 编程来获取我网站内的所有页面链接,因为我想检查我网站每个页面的 pagerank,是否有工具或库或 php 中实现的算法来获取所有页面特定网站的链接?

最佳答案

你可以试试这个:

<?php
  $original_file = file_get_contents("http://www.your_domain.com/page");
  $stripped_file = strip_tags($original_file, "<a>");
  preg_match_all("/<a(?:[^>]*)href=\"([^\"]*)\"(?:[^>]*)>(?:[^<]*)<\/a>/is", $stripped_file, $matches);
?>

$matches[0] 将包含完整的 A 标签;例如:<a href="link">text</a>

$matches[1] 将只包含 A 标签中的 HREF;例如:link

希望对您有所帮助。 问候!

关于php - 如何获取特定站点内的所有页面链接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8470316/

相关文章:

php - nginx php 根目录下有 wordpress 和子目录中的另一个应用程序

php - 将焦点放在 img src 上

java - Lucene搜寻器(需要建立Lucene索引)

php - 使用 mysqli_connect 连接到 Google App Engine 中的 Cloud SQL

php - 如何从 Laravel Controller 写入控制台?

php - MYSQL 值与输入不匹配

http - 内容协商是否中断?

Xpath 到 import.io 的 url

python - urllib2 urlopen 读取超时/ block

multithreading - 对于多线程 http 下载应用程序,您选择的编程语言是什么?