如何提取bs4中div的内容:
>>> Doc
<div class="document">
<p>Text.</p>
<p>More text</p>
</div>
>>> type(Doc)
bs4.element.Tag
我想要得到
<p>Text.</p>
<p>More text</p>
最佳答案
使用.contents
:
>>> Doc = soup.find('div', {'class': 'document'}) # assuming soup is your main content
>>> for i in [x for x in Doc.contents if x != '\n']:
... print i
...
<p>Text.</p>
<p>More text</p>
关于python - 提取div的内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17296243/