我正在写一个蜘蛛,我想知道哪个链接是“下一页”的意思,所以我需要通过值=“下一页”获取元素,然后获取链接。 不是只有一个标签,而是一整套html源码,我想得到具体的链接。
如果我想得到一个像
这样的元素`<a href="http://*****">..</a>`
我可以用
`'a[href^="http"]'`
我试试
`'a[text="value"]'`
最佳答案
尝试“包含”:
from pyquery import PyQuery as pq
doc = pq("<html><body><a href='https://stackoverflow.com'>Next page</a><p>...Next time...</p></body></html>")
el = doc('a:Contains("Next")')
el.text() # 'Next page'
el.attr['href'] # 'https://stackoverflow.com'
关于python - 如何使用pyquery按文本获取元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35968858/