javascript - xpath 无法识别标签

标签 javascript html xpath web-scraping scrapy

我正在尝试使用 xpath 从论坛中抓取 reddit 帖子。 我希望蜘蛛实现的功能之一是,一旦完成从当前页面的抓取,就自动转到下一页。 页面 html 代码如下所示:

<span class="next-button"><a href="https://www.reddit.com/r/InteriorDesign/?count=975&amp;after=t3_8ol7yp" rel="nofollow next" >next &rsaquo;</a></span>

我使用 xpath 选择器作为: response.xpath("//a[@class = 'next-button']") 但它没有给我任何返回。有人可以帮我找出原因吗?

谢谢! 郝

最佳答案

@class 属性位于 span 元素上,而不是 a 链接元素上。因此,将您的 XPath 更改为

response.xpath("//span[@class = 'next-button']/a")

选择a

response.xpath("//span[@class = 'next-button']/a/@href")

获取链接地址。

关于javascript - xpath 无法识别标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50917628/

相关文章:

javascript - 使用正则表达式捕获 `\"` 并拆分为数组

javascript - 如何隔离firefox 17渲染错误

java - jqgrid如何显示服务器端消息

javascript - HTML 文本无法选择但有抽动!无法删除

javascript - Rails 文本区域保存到数据库然后显示

javascript - javascript动态 float 窗口

c# - 从 XPath 中检索与同一节点中的另一个属性值相匹配的属性值

sql-server - 在 SQL 中优化 XML

python-3.x - 无法单击标题(不可见元素)下的HREF

javascript - 带有动态左的GreenSock javascript动画