php - 网页抓取 JAVASCRIPT 内容的语言

标签 php ruby programming-languages web-scraping

我认为主题提出了问题,我通常使用 PHP 进行解析/网络抓取,但我在抓取 javascript 时真的很糟糕,大多数情况下我做不到

例如:解析执行 javascript 时出现的 div。

我读过有关 RUBY 的文章,它有一个 javascript 解析器库,所以问题是 w 是一个网络抓取程序的语言,它将有效地抓取 javascript 生成的内容?它是一个 PHP 库,就像用于解析 javascript 内容的 ruby​​ 库一样?

最佳答案

为此有一些策略。根据您的需要,考虑以编程方式实例化一个浏览器实例,您可以连接到该实例并从中读取页面。

想法是,让浏览器完成工作,因为页面是为浏览器而不是您的机器人制作的。然后,您可以使用浏览器插件轻敲并抓取数据,该插件将数据提供给您运行的主要应用程序。

尽管如此,这对于您需要的东西来说可能有点矫枉过正。我将由您决定。

关于php - 网页抓取 JAVASCRIPT 内容的语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6753871/

相关文章:

javascript - 使用 jQuery 动态移动隐藏表

java - Android 向服务器发出请求

programming-languages - 为什么变量名中不允许使用特殊字符?

compiler-construction - 编程语言和编译器

php - 将mysql数据拉入多维数组

php - 在网站的多个选项卡中使用相同的脚本

ruby - 如何使用 RSpec should_receive 期待一些(但不是全部)参数?

ruby-on-rails - 独立 Ruby 脚本中的 Ruby Gem

python - Ruby on Rails 是否与 Google Code API 配合得很好?

operating-system - 非 c 语言如何与操作系统交互?