python - 如何使用 Python 解析无限滚动页面(例如 Wallbase.cc/search/sky)?

标签 python html-parsing beautifulsoup mechanize

不确定 Mechanize 或 BeautifulSoup 是否有任何帮助。任何建议将不胜感激!

最佳答案

Mechanize 和 Beautiful soup 无法与用于无限滚动的 javascript 接口(interface)。

Selenium jar 。

此外,如果您在使用无限滚动时查看 ajax 请求,您会看到一个到 http://wallbase.cc/search/160 的 post 请求,其中包含请求数据:

query:sky
board:123
res_opt:eqeq
res:0x0
aspect:0
nsfw_sfw:1
nsfw_sketchy:0
nsfw_nsfw:0
thpp:32
orderby:relevance
orderby_opt:desc

160对应图片范围所以之前的请求是wallbase.cc/searc/128

关于python - 如何使用 Python 解析无限滚动页面(例如 Wallbase.cc/search/sky)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8156012/

相关文章:

javascript - 如何从 JavaScript 中的 HTML 字符串中提取 div 中的所有内容

php - 使用 DOMDocument,是否可以获取某个 DOM 中存在的所有元素?

c# - 在 WinRT 应用程序中搜索 google

python - 我可以修改漂亮的 soup 标签中的文本而不将其转换为字符串吗?

python - BeautifulSoup 和 python 。无法通过递归获取所有节点,因为出现 "maximum recursion depth exceeded while calling a Python object"错误

python - BeautifulSoup 迭代多个 XML 标签,提取字符串列表

python - 从 Python 向 MySQL 插入 unix 时间戳

python - 将 3d 矩阵转换为特征向量

python - BeautifulSoup - 只返回第一个表

python - 使用 kwd 'sheetname=None' 时 pandas 出错