例如,
<ul>
<li>
<b>Hey, sexy!</b>
Hello
</li>
</ul>
我只想要 li
标记中的“Hello”。
如果我使用 soup.find("ul").li.text
它也包含 b
标签。
最佳答案
您可以使用 find
像这样的功能
from bs4 import BeautifulSoup
html = '''<ul><li><b>Hey, sexy!</b>Hello</li></ul>'''
soup = BeautifulSoup(html)
print soup.find('li').find(text=True, recursive=False)
关于web-scraping - 如何在 BeautifulSoup 中只获取标签的内部文本,不包括嵌入的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28685753/