我认为主题提出了问题,我通常使用 PHP 进行解析/网络抓取,但我在抓取 javascript 时真的很糟糕,大多数情况下我做不到
例如:解析执行 javascript 时出现的 div。
我读过有关 RUBY 的文章,它有一个 javascript 解析器库,所以问题是 w 是一个网络抓取程序的语言,它将有效地抓取 javascript 生成的内容?它是一个 PHP 库,就像用于解析 javascript 内容的 ruby 库一样?
最佳答案
为此有一些策略。根据您的需要,考虑以编程方式实例化一个浏览器实例,您可以连接到该实例并从中读取页面。
想法是,让浏览器完成工作,因为页面是为浏览器而不是您的机器人制作的。然后,您可以使用浏览器插件轻敲并抓取数据,该插件将数据提供给您运行的主要应用程序。
尽管如此,这对于您需要的东西来说可能有点矫枉过正。我将由您决定。
关于php - 网页抓取 JAVASCRIPT 内容的语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6753871/