python - 网页抓取 - 使用 BeautifulSoup 和 Python 从类(class)中获取文本?

标签 python web-scraping beautifulsoup

我想从网站上抓取文本(“显示 650 个结果”)。

我正在寻找的结果是:

 Result : Showing 650 results

以下是Html代码:

<div class="jobs-search-results__count-sort pt3">
            <div class="jobs-search-results__count-string results-count-string Sans-15px-black-55% pb0 pl5 pr4">
                Showing 650 results
            </div>

Python 代码:

    response = requests.get(index_url)
    soup = BeautifulSoup(response.text, 'html.parser')
    text = {}
    link = "jobs-search-results__count-string results-count-string Sans-15px-black-55% pb0 pl5 pr4" 
    for div in soup.find_all('div',attrs={"class" : link}):
        text[div.text]
    text

到目前为止,我的代码似乎无法正常工作。

最佳答案

  1. 您不需要soup.find_all如果您仅查找一个元素,soup.find效果也一样

  2. 您可以使用tag.string/tag.contents/tag.text访问内部文本

<小时/>
div = soup.find('div', {"class" : link})
text = div.string

关于python - 网页抓取 - 使用 BeautifulSoup 和 Python 从类(class)中获取文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45449380/

相关文章:

Python:对同一个程序使用多个Python窗口

python - 如何在同一函数内使用从字符串创建的全局变量?

python - 如果条件通过则返回方法结果的简写形式

python - 在 scrapy 上找到合适的选择器 css 来爬取网页

python - 使用 Beautiful Soup 和 Python 从搜索页面提取 HTML 内容

Python Tkinter : How to modify the font of the Menu widget?

python - 需要用scrapy抓取表

html - 包含在一个 XML 元素或另一个 XML 元素中的字符串的 XPath?

python - 如何从列表中的表行中获取表头和表数据?

python - BeautifulSoup属性错误: 'NoneType' object has no attribute 'text'