python - 使用 selenium 从网站获取跨度文本

标签 python selenium web-scraping automation

我试图抓取的网站如下所示:

<div align="center" class="movietable">
    <span style="width:45px;height:47px;vertical-align:middle;display:table-cell;">
        <a href="browse.php?cat=19"><img border="0" src="styles/images/cat/hd.png" alt="HdO"></a>
    </span>
</div>
<div align="left" class="movietable">
    <span style="padding:0px 5px;width:455px;height:47px;vertical-align:middle;display:table-cell;">
        <a data-toggle="tooltip" data-placement="bottom" data-html="true" title="" href="details.php?id=578197" data-original-title="<img src='https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg'>">
            <b>GET THIS TEXT</b></a><br><font class="small">[Action, Horror, Sci-Fi]</font>
        </span>
    </div>

如何提取:

<b> 中的文本标签 - 在本例中 GET THIS TEXT
font_class= 'small' 的内容 - 在本例中为 Action, Horror, Sci-Fi
.movietable b 效果很好!!
img_scr 链接 - 在本例中它将是 https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg

我不知道该怎么做

最佳答案

以下是您可以使用的 CSS 选择器:

driver.find_element_by_css_selector('div[align=left] b')
driver.find_element_by_css_selector('div[align=left] .small')
driver.find_element_by_css_selector('a[title]').get_attribute('data-original-title')

关于python - 使用 selenium 从网站获取跨度文本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51973860/

上一篇：Python:循环连接多个(200+)netCDF文件以形成一个文件

下一篇：python - Keras GRU 模型仅预测 [-0., -0., -0., -0., -0.]

相关文章：

python - 使用 python 在文本中查找表情符号

python - Python 函数 "compile"和 "compiler.parse"是否安全(沙盒)？

python - 根据索引范围插入列值

node.js - 为什么我在使用 selenium chromedriver 时会出现此错误？

java - Selenium 中的元素在 (X, Y) 点不可点击

excel - 如何提交登录凭据？

python - 使用网页抓取来检查商品是否有库存

python - 将 SqlAlchemy 集成到 Django 项目中的最佳方式

java - Selenium 将 Web 表格与 Excel 数据进行比较

python - 使用 SPLIT 创建 HTML 列表