python - 如何使用pyquery按文本获取元素?

标签 python pyquery

我正在写一个蜘蛛,我想知道哪个链接是“下一页”的意思,所以我需要通过值=“下一页”获取元素,然后获取链接。 不是只有一个标签,而是一整套html源码,我想得到具体的链接。

如果我想得到一个像

这样的元素
`<a href="http://*****">..</a>`

我可以用

`'a[href^="http"]'`

我试试

`'a[text="value"]'`

最佳答案

尝试“包含”:

from pyquery import PyQuery as pq

doc = pq("<html><body><a href='https://stackoverflow.com'>Next page</a><p>...Next time...</p></body></html>")

el = doc('a:Contains("Next")')
el.text()         # 'Next page'
el.attr['href']   # 'https://stackoverflow.com'

关于python - 如何使用pyquery按文本获取元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35968858/

相关文章:

python - 如何按字符串而不是按字符拆分列表中的值?

python - NameError:未定义全局名称

python - Plist一直加载不结束,满足条件也不退出

python - 将两个独立图与 matplotlib 结合的最佳方法是什么?

python - 通过 Python 发送多个 HTTP 请求的理想方法?

python - 通过 Pip 安装 PyQuery

python - 广告扰乱了我的文章爬行

python - 如何在将 pyquery 对象转换为字符串时取消转义特殊字符