python-3.x - 如何通过Python中的Beautiful Soup找到类中的文本和类名中的空格?

标签 python-3.x web-scraping beautifulsoup

例如,我有一个类(class) <div>和一个有空格的类。

<div class="class name having spaces"> </div>

最佳答案

from bs4 import BeautifulSoup
doc ='''<div class='the value'><\div>'''
soup = BeautifulSoup(doc, 'lxml')

print(soup.find_all(attrs={'class':'the value'}))
print(soup.find_all(class_='the value'))
# if the part of value is uniqu, you can use them separately
print(soup.find_all(class_='the'))        
print(soup.find_all(class_='value'))

输出:

[<div class="the value"></div>]
[<div class="the value"></div>]
[<div class="the value"></div>]
[<div class="the value"></div>]

关于python-3.x - 如何通过Python中的Beautiful Soup找到类中的文本和类名中的空格?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40605305/

相关文章:

Python 网页抓取 : I have a website with pick list. 以及如何提取这些列表中的文本

python - 如何检查标签 <a> 或/和 <img> 是否是 Beautiful Soup 上 div 的子项

Python - BeautifulSoup,在标签中获取标签

python - 刮痧用美汤和 Selenium 问题

python - Pygame 运行缓慢

python-3.x - boto3 和 dynamodb-local 的 batch_write 操作极其缓慢

python - 运行程序一分钟然后暂停一分钟的最简单方法是什么

python - 具有 1 个和 2 个可迭代元素的列表的字典理解

ruby - 使用 Mechanize 和 nokogiri 使用正确的 xpath 抓取页面

python - ImportError 没有名为 BeautifulSoup 的模块 - 路径错误