我有以下 html:
<html ><body >Body text <div >div content</div></body></html>
没有嵌套 <div>
如何获取正文内容?
我需要获取“正文”,但不知道如何执行此操作。
运行结果
$domhtml = DOMDocument::loadHTML($html);
print $domhtml->getElementsByTagName('body')->item(0)->nodeValue;
是'Body textdiv content',这不是我想要得到的
最佳答案
我更喜欢 DOMXPath对于这样的问题。非常灵活
$domhtml = DOMDocument::loadHTML($html);
$xpath = new DOMXPath($domhtml);
$query="/html/body/text()"; //gets all text nodes that are direct children of body
$txtnodes = $xpath->query($query);
foreach ($txtnodes as $txt) {
echo $txt->nodeValue;
}
关于php - 通过 DOMDocument 获取具有子节点的节点的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2966868/