php - 使用 PHP 从网页中提取特定数据

标签 php html screen-scraping

<分区>

Possible Duplicate:
HTML Scraping in Php

我想知道是否有任何方法可以使用 PHP 从网页获取不时更新的特定文本字符串。我搜索了“整个互联网”,但一无所获。刚看到preg_match可以,但是没看懂怎么用。

假设一个网页包含以下内容:

<div name="changeable_text">**GET THIS TEXT**</div>

在使用 file_get_contents 之后,我如何使用 PHP 来完成它?将页面放在变量中?

提前致谢:)

最佳答案

您可以使用 DOMDocument ,像这样:

$html = file_get_contents( $url);

libxml_use_internal_errors( true);
$doc = new DOMDocument;
$doc->loadHTML( $html);
$xpath = new DOMXpath( $doc);

// A name attribute on a <div>???
$node = $xpath->query( '//div[@name="changeable_text"]')->item( 0);

echo $node->textContent; // This will print **GET THIS TEXT**

关于php - 使用 PHP 从网页中提取特定数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11567632/

相关文章:

php - 计算指定日期的总天数

php - SF3 [翻译][控制台] 翻译 :update yaml nesting

javascript - 如何远程使用 javascript 自动完成和 php

html - 如何做 HTML/CSS 表单助手/popover

screen-scraping - 替代 HtmlUnit

php - 使用 MySQL 渲染 HTML 页面(动态线)

javascript - 页面打开时加载模态

javascript - CSS 问题 : Chrome adds 3px extra margin-right to text field

windows - 是否可以使用 ruby​​ 来抓取 Windows 应用程序的屏幕?

ruby-on-rails - 如何知道delayed_job 什么时候完成了它的工作?