html - Lxml cssselect 通配符

标签 html xpath screen-scraping lxml

如何使用 cssselect 获取所有通配符元素?

例如:

content = """
<table>
<tr id='Awesome1234'><a href="link1"></a></tr>
<tr id='Awesome5678'><a href="link2"></a></tr>
</table>
"""
doc = lxml.html.fromstring(html)
links = lxml.cssselection('tr.Awesome* a')
for link in links:
    print link.get('href')

我希望它输出:

 link1
 link2

这可以用 cssselect 实现吗?如果没有,我怎么能得到这个? (xpath?)

最佳答案

^= 比较运算符似乎适合您:

tr[id^=Awesome] a

关于html - Lxml cssselect 通配符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5590914/

相关文章:

php - 使用php对sql表执行操作

javascript - jQuery HTML 验证子表单

xml - 错误!关于我使用的所选 XPath 有什么建议吗?

node.js - 使用 Cheerio 抓取时出现问题

html - 图像定位

javascript - 通过javascript从MySQL数据库读取数据并相应地改变radio的prop

css - nth-child() 和 eq() 有什么区别

html - XPath 选择该父 div 内的 <div> 的所有文本内容排除特定的 <div> 标记

python 请求有时会返回空列表

java - 使用Jsoup登录该页面失败