javascript - 如何从 Xpath 中的 javascript 事件处理程序获取链接?

标签 javascript python xpath web-scraping scrapy

下面给出了 Html 代码片段。我想要一些response.xpath(......)来获取分页的链接。我尝试做

 response.xpath('//*[@class="ui2-pagination-pages"]/a/@href').extract()   

但它没有给出任何东西。我在这里做错了什么?谢谢。

<div class="ui2-pagination-pages">
         <a href="javascript:void(0)" class="prev" data-role="prev">Prev</a>
        <a rel="nofollow" href="//www.alibaba.com/showroom/acrylic-wine-box_1.html">1</a>
         <a rel="nofollow" href="//www.alibaba.com/showroom/acrylic-wine-box_2.html">2</a>
        <a rel="nofollow" href="//www.alibaba.com/showroom/acrylic-wine-box_3.html">3</a>
        <span class="current">4</span>
         <a rel="nofollow" href="//www.alibaba.com/showroom/acrylic-wine-box_5.html">5</a>
         <a rel="nofollow" href="//www.alibaba.com/showroom/acrylic-wine-<span class="interim">...</span>
        <a rel="nofollow" href="//www.alibaba.com/showroom/acrylic-wine-box_103.html">103</a>
        <a href="javascript:void(0)" class="next" data-role="next">Next</a>
        </div>

我想废弃所有分页链接并希望循环浏览它。我该怎么做?

最佳答案

发生这个问题是因为您想要抓取的网站使用 Javascript 来呈现其内容,并且基本上蜘蛛无法执行 javascript 代码,他们没有可以真正解释它的引擎,为此目的 ScrapingHub 团队创建了一个名为scrapysplash的插件。

你可以从他们的官方github页面查看:Github

关于javascript - 如何从 Xpath 中的 javascript 事件处理程序获取链接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51914968/

相关文章:

javascript - ScrollMagic 和 GSAP 仅限移动设备

javascript - 变量的 setter 可以调用它的 getter

python - 在 SQLAlchemy 中手动构建 SQL 查询时如何正确转义字符串?

python - 如何从一个 xpath 选择器获取一组值(多个值)?

javascript - 如何在矩形外最小化一个圆圈?

javascript - 如何使用php和mysql在特定编号位置显示数据?

sql-server - Postgres OpenXML

selenium - 在 RPA Express 中使用 Web 元素处理和跟踪链接

python - 如何选择除最后两个 tr 之外的所有 tr

python - Jinja2:如何在包含的模板、可扩展模板中使用命名 block