python - 提取div的内容?

标签 python html beautifulsoup

如何提取bs4中div的内容:

>>> Doc
<div class="document">
<p>Text.</p>
<p>More text</p>
</div>

>>> type(Doc)
bs4.element.Tag

我想要得到

<p>Text.</p>
<p>More text</p>

最佳答案

使用.contents :

>>> Doc = soup.find('div', {'class': 'document'}) # assuming soup is your main content
>>> for i in [x for x in Doc.contents if x != '\n']:
...     print i
... 
<p>Text.</p>
<p>More text</p>

关于python - 提取div的内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17296243/

相关文章:

python - 导入函数并将其分配给变量

javascript - 如何在文本框中获得水平线光标(就像在命令行上一样)?

html - 从另一种风格继承另一种风格

python - 如何用美汤获取within::before和::after的内容?

python - 用 python 抓取表格

python - Twilio - 生成 6 位随机数

Python pandas将列表插入单元格

python - 减少大型分类变量的级别数

javascript - 使用javascript将输入标签的值设置为另一个值

python - 从包含在 ajax 驱动的弹出框中的工具提示中刮取文本