javascript - 当url不改变时解析数据(分页)

标签 javascript python ajax parsing web-scraping

我有兴趣解析来自 here 的数据。但是,除了默认页面之外,我无法 parse older 之一或newer数据,因为 url 没有变化地址。我如何获取默认页面以外的数据?我长期以来一直在努力寻找解决方案,非常感谢任何帮助。我正在使用python 3.6lxmlrequests用于解析urls

最佳答案

该网站的运作方式:

当页面首次加载时,它会加载 HTML 中的当前数据。每当您在分页中单击oldernewer时,它都会向此网址发出GET请求:

https://markets.ft.com/data/world/ajax/getnextecoevents?rowId=79519&scrollForward=true&filter=%7B%22keyword%22%3A%22%22%2C%22impact%22%3A%22%22%2C%22countries%22%3A%5B%5D%7D`

注意 URL 参数:

rowId, scrollForward, filter

解决方案:

对上面的 URL 发出自定义请求,但只需减少或增加 rowId 参数即可滚动浏览页面。

例如:

GET https://markets.ft.com/data/world/ajax/getnextecoevents?rowId=79519
GET https://markets.ft.com/data/world/ajax/getnextecoevents?rowId=79520
GET https://markets.ft.com/data/world/ajax/getnextecoevents?rowId=79521

关于javascript - 当url不改变时解析数据(分页),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46081235/

相关文章:

python - 如何编写正确的 setup.py

python - 用 Pandas 导入数据时卡住了错误

php - 当用户单击 Laravel 4 中的表头时,如何按表排序?

javascript - JavaScript 最大 Blob 大小是否有任何限制

php - ajax登录成功数据但不重定向到索引页面

javascript - RequireJS require.toUrl ('../' )无法按我的预期工作

javascript - HTTP_ORIGIN header 未通过 jquery ajax 发送

javascript - React.js 排序大数组

javascript - 如何防止 jQuery .remove() 删除父类

c++ - 在 C++ 中捕获 Python 异常