我想用python阅读这个网页
http://www.hm.com/us/subdepartment/LADIES?Nr=4294962278#Nr=4294962278&size=100
网页源代码中只有24个产品url(http://www.hm.com/us/product.*)
虽然在网页本身(不是来源)中,我看到了超过 24 种产品。
我如何才能阅读所有产品而不仅仅是前 24 个?
它可能与 css 和 url 中的参数有关,但我对此不太了解,如果有人能提供帮助,我将不胜感激。
谢谢。
最佳答案
其余部分由 javascript 加载,这是客户端,这就是为什么当您查看源代码时除了原始的 24 之外什么都没有,如果您禁用 javascript 然后查看页面您将只看到第一个。
除非有适用于 Python 的 JS 渲染器,否则您可能会倒霉?
或者调用 javascript 调用的相同页面
关于javascript - 如何阅读网页中未出现在页面源中的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12912305/