python - 使用 BeautifulSoup 中的 .select() 从网页中提取数字时使用哪些 CSS 选择器?

标签 python beautifulsoup

我正在尝试使用 python 从网页中提取当前股票价格。我在使用 Beautiful Soup 提取数字时遇到问题。我不知道要使用什么 CSS 选择器。我试过 span、div、tr、tbody、td 的组合。附件是 HTML 的图片。请注意,我之后的数字是 368.45:

HTML:

HTML

这是我的 python3 代码的本质(我使用的是 Ubuntu 以防万一):

res = requests.get(#webpage_url)
res.raise_for_status()
soup = bs4.BeautifulSoup(res.text, "lxml")
stock_price = soup.select(#what CSS selector do I use?)
print(stock_price[0].getText()) 

我基本上只是问我如何使用 .select() 方法来获取附加的 HTML 快照中的突出显示文本。

最佳答案

您可以尝试将单元格与包含跨度的 posquote 类匹配,并从那里获取字符串

stock_price = soup.find('td', class_='posquote').string

关于python - 使用 BeautifulSoup 中的 .select() 从网页中提取数字时使用哪些 CSS 选择器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50916111/

相关文章:

python - Django:禁止(CSRF token 丢失或不正确。)

python - certificate-transparency 如何查询域的证书

python | Selenium |继续输出页面源代码,而不是我手动检查元素时看到的内容

python - 无法理解如何使用 findNextSiblings

Python:BeautifulSoup Findall 跳到下一个标签

python - AES-GCM 模式的正确 nonce/iv 大小

python - Seaborn Plot 包括相同数据的不同分布

python - 为什么在 python 中部署包时缺少 aws lambda 中的依赖项?

python - 使用 Beautiful Soup 抓取网站时出现编码错误

python - ImportError 没有名为 BeautifulSoup 的模块 - 路径错误