我试图抓取的网站如下所示:
<div align="center" class="movietable">
<span style="width:45px;height:47px;vertical-align:middle;display:table-cell;">
<a href="browse.php?cat=19"><img border="0" src="styles/images/cat/hd.png" alt="HdO"></a>
</span>
</div>
<div align="left" class="movietable">
<span style="padding:0px 5px;width:455px;height:47px;vertical-align:middle;display:table-cell;">
<a data-toggle="tooltip" data-placement="bottom" data-html="true" title="" href="details.php?id=578197" data-original-title="<img src='https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg'>">
<b>GET THIS TEXT</b></a><br><font class="small">[Action, Horror, Sci-Fi]</font>
</span>
</div>
如何提取:
-
<b>
中的文本标签 - 在本例中GET THIS TEXT
font_class= 'small' 的内容 - 在本例中为
Action, Horror, Sci-Fi
.movietable b 效果很好!!img_scr 链接 - 在本例中它将是
https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg
我不知道该怎么做
最佳答案
以下是您可以使用的 CSS 选择器:
driver.find_element_by_css_selector('div[align=left] b')
driver.find_element_by_css_selector('div[align=left] .small')
driver.find_element_by_css_selector('a[title]').get_attribute('data-original-title')
关于python - 使用 selenium 从网站获取跨度文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51973860/