html:
<h2>...</h2>
<p>...</p>
<p>...</p>
<p>...</p>
<h2>...</h2>
<p>...</p>
<p>...</p>
<p>...</p>
<p>...</p>
预期结果:
<p>...</p>
<p>...</p>
<p>...</p>
我的意思是,获取 h2
元素之间的所有内容
最佳答案
每个元素都有一个 nextSibling method ,因此您可以只获取第一个 h2 元素,然后遍历下一个兄弟元素,直到找到第二个元素。
伪代码(假设 firstElem 是 h2 元素):
p_tags = []
next = firstElem.nextSilbing
while next.name != "h2":
p_tags.append(next)
next = next.nextSibling
关于python - Beautifulsoup:如何在其他元素之间获取元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5440098/