我有兴趣解析来自 here 的数据。但是,除了默认页面之外,我无法 parse
older
之一或newer
数据,因为 url
没有变化地址。我如何获取默认页面以外的数据?我长期以来一直在努力寻找解决方案,非常感谢任何帮助。我正在使用python 3.6
与 lxml
和requests
用于解析urls
最佳答案
该网站的运作方式:
当页面首次加载时,它会加载 HTML 中的当前数据。每当您在分页中单击older
或newer
时,它都会向此网址发出GET
请求:
https://markets.ft.com/data/world/ajax/getnextecoevents?rowId=79519&scrollForward=true&filter=%7B%22keyword%22%3A%22%22%2C%22impact%22%3A%22%22%2C%22countries%22%3A%5B%5D%7D`
注意 URL 参数:
rowId, scrollForward, filter
解决方案:
对上面的 URL 发出自定义请求,但只需减少或增加 rowId
参数即可滚动浏览页面。
例如:
GET https://markets.ft.com/data/world/ajax/getnextecoevents?rowId=79519
GET https://markets.ft.com/data/world/ajax/getnextecoevents?rowId=79520
GET https://markets.ft.com/data/world/ajax/getnextecoevents?rowId=79521
关于javascript - 当url不改变时解析数据(分页),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46081235/