维基百科文章具有以下结构:
<div id="bodyContent">
<div id="siteSub">...</div>
<div id="contentSub"></div>
<div id="jump-to-nav">...</div>
<table class="infobox vevent">...</table>
<p>Article summary</p>
<p>Article summary continued</p>
<p>Article summary continued</p>
<table id="toc" class="toc">...</table>
<h2>...</h2>
<p>...</p>
<p>...</p>
</div>
我对摘要部分感兴趣。对于Xpath,我想说:
从开始返回
<p>
内部的#bodyContent
节点,并在遇到第一个<h2>
时立即停止我怎么说呢?
最佳答案
我想您想要的是//div[@id="bodyContent"]/h2[1]/preceding-sibling::p
之类的东西。
这表示“从#bodyContent
的子级中找到第一个h2
元素,并在其先前的同级中找到所有p
元素”。
关于php - PHP-返回所有段落直到第一个<h2>,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5950700/