我正在尝试解析 Twitch.tv website 中的一些内容作为 Nokogiri 的学习练习。
当获取 HTML 文档时,我没有获得在 Google Chrome 上看到的源,内容似乎是通过 Javascript 加载的,而不是在初始 GET 请求中加载的。
如何使用 Nokogiri 解析来自该网站的流列表?或者更笼统地说,如何解析在 DOM 完成加载后动态加载的内容?
最佳答案
数据是 json,所以你不使用 nokogiri。例如:
require 'open-uri'
require 'json'
hash = JSON.parse open('http://api.twitch.tv/kraken/games/top?limit=10&on_site=1').read
关于ruby - 当使用 Javascript 加载内容时,如何使用 Nokogiri 解析页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14805416/