我正在尝试阅读页面的源代码。我只想读取 ID 为“wrapper_left”的某个划分元素内的一些文本。
我的问题是,如果在explode函数的第一个参数中使用素数“,它就不起作用。我尝试转义字符串,尽管我认为这不会做任何事情。
$source_code = htmlspecialchars(file_get_contents('http://mydomain.com'));
$source_code = explode('<div id="wrapper_left">', $source_code);
echo $source_code[1];
提前致谢。
最佳答案
不必费心尝试使用 explode()
、字符串操作或正则表达式来完成此操作,您需要一个 HTML 解析器,例如 DOMDocument
:
$doc = new DOMDocument;
$doc->loadHTMLFile( 'http://mydomain.com');
$xpath = new DOMXPath( $doc);
$div = $xpath->query( '//div[@id="wrapper_left"]')->item(0);
echo $div->textContent;
您可以在 this demo 中看到它的工作情况,当输入此 HTML 时:
<div id="wrapper_left">Some text</div>
它产生:
Some text
关于php - 使用带有素数的 PHP 读取页面源代码“,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13437505/