搜索了一下,但找不到任何符合我的问题的帖子。
假设我有这个 html:
<div id=a>
<span>junk</span>
content
</div>
有没有办法让我获得“内容”?
doc.find(id="a").string
返回 None
doc.find(id="a").text
返回“垃圾内容”
最佳答案
有多种方法:
查找所有带有
recursive=False
的文本节点并获取最后一个:div.find_all(text=True, recursive=False)[-1]
获取
span
的元素next sibling :div.span.next_sibling.strip()
获取
.contents
中的最后一个元素:div.contents[-1].strip()
其中div = doc.find(id="a")
。
关于python - 使用 BeautifulSoup 获取在其值之前有另一个标签的标签的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28292830/