我正在使用 python2.7.6、urllib2 和 BeautifulSoup
从网站中提取 html 并存储在变量中。
如何使用 beautifulsoup 仅显示带有 id 的 div
的 html 内容?
<div id='theDiv'>
<p>div content</p>
<p>div stuff</p>
<p>div thing</p>
会是
<p>div content</p>
<p>div stuff</p>
<p>div thing</p>
最佳答案
加入div标签的元素.contents
:
from bs4 import BeautifulSoup
data = """
<div id='theDiv'>
<p>div content</p>
<p>div stuff</p>
<p>div thing</p>
</div>
"""
soup = BeautifulSoup(data)
div = soup.find('div', id='theDiv')
print ''.join(map(str, div.contents))
打印:
<p>div content</p>
<p>div stuff</p>
<p>div thing</p>
关于python - 使用 BeautifulSoup 通过 id 获取 div 的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25614702/