javascript - 当url不改变时解析数据(分页)

标签 javascript python ajax parsing web-scraping

我有兴趣解析来自 here 的数据。但是，除了默认页面之外，我无法 parse older 之一或newer数据，因为 url 没有变化地址。我如何获取默认页面以外的数据？我长期以来一直在努力寻找解决方案，非常感谢任何帮助。我正在使用python 3.6与 lxml和requests用于解析urls

最佳答案

该网站的运作方式:

当页面首次加载时，它会加载 HTML 中的当前数据。每当您在分页中单击older或newer时，它都会向此网址发出GET请求:

https://markets.ft.com/data/world/ajax/getnextecoevents?rowId=79519&scrollForward=true&filter=%7B%22keyword%22%3A%22%22%2C%22impact%22%3A%22%22%2C%22countries%22%3A%5B%5D%7D`

注意 URL 参数:

rowId, scrollForward, filter

解决方案:

对上面的 URL 发出自定义请求，但只需减少或增加 rowId 参数即可滚动浏览页面。

例如:

GET https://markets.ft.com/data/world/ajax/getnextecoevents?rowId=79519
GET https://markets.ft.com/data/world/ajax/getnextecoevents?rowId=79520
GET https://markets.ft.com/data/world/ajax/getnextecoevents?rowId=79521

关于javascript - 当url不改变时解析数据(分页)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46081235/

上一篇：javascript - 与 JSX 语法中的解构赋值相混淆

下一篇：javascript - 箭头函数和 `this`

相关文章：

python - 如何编写正确的 setup.py

python - 用 Pandas 导入数据时卡住了错误

php - 当用户单击 Laravel 4 中的表头时，如何按表排序？

javascript - JavaScript 最大 Blob 大小是否有任何限制

php - ajax登录成功数据但不重定向到索引页面

javascript - RequireJS require.toUrl ('../' )无法按我的预期工作

javascript - HTTP_ORIGIN header 未通过 jquery ajax 发送

javascript - React.js 排序大数组

javascript - 如何防止 jQuery .remove() 删除父类

c++ - 在 C++ 中捕获 Python 异常