我的html如下:
html = '<html><table>this is a table<p>some text</p></table><p>text outside of table</p></html>'
我想移动到表的末尾,然后找到下一个标签。我尝试使用 findNext,但如果表内有标签,它会找到该标签,而不是表外的下一个标签。
soup = BeautifulSoup(''.join(text))
table = soup.find('table')
test = table.findNext()
这段代码给我:
<p>some text</p>
但是,我希望它给我:
<p>text outside of table</p>
主要问题是我不能总是指定标签是“p”标签。我可以有这样的 html:
html = '<html><table>this is a table<td>some text</td></table><table>text outside of table</table></html>'
所以,我不能真正依赖标签标识符来进入下一个。在上面的代码中,我想返回:
<table>text outside of table</table>
我意识到我可以只使用 findNext 两次,但每个表中通常有数百个标签,所以这是行不通的。
最佳答案
会
test = table.nextSibling
为你工作?
关于python - 如何在 python 中使用 BeautifulSoup 移动到标签的末尾?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8370874/