我需要在页面上的 JavaScript 加载后抓取(公共(public))HTML 数据。经过一些研究后,我发现 PhantomJS 可以帮助完成这项任务。但是,虽然我可以将 PhantomJS 添加到本地计算机,但我不知道如何将其添加到我的 chrome 扩展中。有人知道我怎样才能做到这一点吗?
最佳答案
你不能。 PhantomJS 是一个网络浏览器,而不是一个 Javascript 库。
替代方案 1. 从 Chrome 扩展程序中抓取
您可以使用 Chrome 扩展 API 执行以下操作:
- 创建一个包含您要抓取的页面的标签
- 将内容脚本加载到选项卡中:
- 等待页面完成加载
- 抓取您想要的数据
- 将抓取的数据发送到您需要的任何地方
- 关闭标签
替代方案 2. 使用在您自己的服务器上运行的 headless 浏览器进行抓取
使用 Google 自己的 headless Chrome 库 puppeteer来抓取你想要的数据。免费开始使用的一个简单方法是使用 Google App Engine Standard Tier NodeJS instance .
关于javascript - 如何将 PhantomJS 添加到我的 Chrome 扩展程序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50859904/