我正在尝试抓取产品视频链接(由另一个网络服务动态生成。位置在左侧产品图片下方)。您可以查看以下链接, https://www.tokopedia.com/chocoapple/ready-stock-bnib-iphone-128gb-7-plus-jet-black-garansi-apple-1-tahun-10?src=topads 谷歌浏览器“检查元素”显示了 div 标签。但是页面源中不存在相同的标记。 怎么做?我正在研究 goQuery 以实现该任务,但不确定它是否有效。我不是网络开发人员,所以如果我的问题描述不具体,请考虑提出建议。 谢谢。
最佳答案
如果标签不在源中,那么 GoQuery 将不起作用。 GoQuery 用于使用类似 jQuery 的 API 解析 HTML 源代码。
您需要先使用像 phantomjs 这样的 headless WebKit 处理网页,chromeless , 或 puppeteer .这些工具中的每一个都允许您在处理网页之前处理网页上的所有 Javascript。这样,将处理用于呈现您感兴趣的视频的 AJAX 并更新源。然后,您可以下载相应的源代码,其中应包含该 div。
关于Go 语言刮刀。如何抓取网站上动态生成的链接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45905550/