我想处理一个包含大量 HTML 但本身不是有效 HTML 文件的 HTTP 响应。
我知道我可以按如下方式使用 Nokogiri:page = Nokogiri::HTML.parse(page.body)
,但是,我想访问 Mechanize
方法如 Mechanize::Page.search
.有什么方法可以将此 HTML 用作 Mechanize::Page ,还是通过其他一些 Mechanize 类(class)?
最佳答案
实际上,看起来我已经找到了自己问题的答案:
page = Mechanize::Page.new(URI.parse('http://example.com'), {'content-type'=>'text/html'},(page.body), 200, agent)
关于ruby - 使用 Mechanize (Ruby) 解析格式错误的 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11979359/