python - 使用 selenium 从网站获取跨度文本

标签 python selenium web-scraping automation

我试图抓取的网站如下所示:

<div align="center" class="movietable">
    <span style="width:45px;height:47px;vertical-align:middle;display:table-cell;">
        <a href="browse.php?cat=19"><img border="0" src="styles/images/cat/hd.png" alt="HdO"></a>
    </span>
</div>
<div align="left" class="movietable">
    <span style="padding:0px 5px;width:455px;height:47px;vertical-align:middle;display:table-cell;">
        <a data-toggle="tooltip" data-placement="bottom" data-html="true" title="" href="details.php?id=578197" data-original-title="<img src='https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg'>">
            <b>GET THIS TEXT</b></a><br><font class="small">[Action, Horror, Sci-Fi]</font>
        </span>
    </div>

如何提取:

  1. <b> 中的文本标签 - 在本例中 GET THIS TEXT
  2. font_class= 'small' 的内容 - 在本例中为 Action, Horror, Sci-Fi
    .movi​​etable b 效果很好!!

  3. img_scr 链接 - 在本例中它将是 https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg

我不知道该怎么做

最佳答案

以下是您可以使用的 CSS 选择器:

  1. driver.find_element_by_css_selector('div[align=left] b')
  2. driver.find_element_by_css_selector('div[align=left] .small')
  3. driver.find_element_by_css_selector('a[title]').get_attribute('data-original-title')

关于python - 使用 selenium 从网站获取跨度文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51973860/

相关文章:

python - 使用 python 在文本中查找表情符号

python - Python 函数 "compile"和 "compiler.parse"是否安全(沙盒)?

python - 根据索引范围插入列值

node.js - 为什么我在使用 selenium chromedriver 时会出现此错误?

java - Selenium 中的元素在 (X, Y) 点不可点击

excel - 如何提交登录凭据?

python - 使用网页抓取来检查商品是否有库存

python - 将 SqlAlchemy 集成到 Django 项目中的最佳方式

java - Selenium 将 Web 表格与 Excel 数据进行比较

python - 使用 SPLIT 创建 HTML 列表