python - 如何使用pyquery按文本获取元素？

我正在写一个蜘蛛，我想知道哪个链接是“下一页”的意思，所以我需要通过值=“下一页”获取元素，然后获取链接。不是只有一个标签，而是一整套html源码，我想得到具体的链接。

如果我想得到一个像

这样的元素

`<a href="http://*****">..</a>`

我可以用

`'a[href^="http"]'`

我试试

`'a[text="value"]'`

最佳答案

尝试“包含”:

from pyquery import PyQuery as pq

doc = pq("<html><body><a href='https://stackoverflow.com'>Next page</a><p>...Next time...</p></body></html>")

el = doc('a:Contains("Next")')
el.text()         # 'Next page'
el.attr['href']   # 'https://stackoverflow.com'

关于python - 如何使用pyquery按文本获取元素？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35968858/

上一篇：python - 找出还有谁在引用，大数据

下一篇：python - 在 python 中搜索给定字符串的超字符串列表的最快方法

相关文章：

python - 如何按字符串而不是按字符拆分列表中的值？

python - NameError:未定义全局名称

python - Plist一直加载不结束，满足条件也不退出

python - 将两个独立图与 matplotlib 结合的最佳方法是什么？

python - 通过 Python 发送多个 HTTP 请求的理想方法？

python - 通过 Pip 安装 PyQuery

python - 广告扰乱了我的文章爬行

python - 如何在将 pyquery 对象转换为字符串时取消转义特殊字符