ruby-on-rails - Mechanize 从 HTML 中提取图像

标签 ruby-on-rails ruby image nokogiri mechanize

如何使用 Mechanize 或 Nokogiri 从当前页面提取特定图像的 src 参数？

图像在类似这样的东西里面:

<div class="aaa">
    <div id="bbb">
        <div class="pp">
        <img src="/user/photo/photo01" alt="photo">
        </div>
    </div>
</div>

这是我正在尝试的:

agent = ::Mechanize.new
agent.get ("some html url page")
doc = Nokogiri::HTML(open(agent.page.uri.to_s))
@result = doc.css('img')

感谢任何帮助。

最佳答案

以下将打印 .aaa 和 #bbb div 中每个 a 标签的 src 属性:

html = %Q{
  <div class="aaa">
    <div id="bbb">
      <div class="pp">
        <img src="/user/photo/photo01" alt="photo">
       </div>
     </div>
   </div>
}

doc = Nokogiri(html)
doc.search('.aaa #bbb img').each |link| 
  puts link.attr('src')
end

关于ruby-on-rails - Mechanize 从 HTML 中提取图像，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30040925/

上一篇：ruby-on-rails - 从简单的树顶解析器获取日期部分 : wrong argument type Class (expected Module)

下一篇：ruby-on-rails - time created_at + 1 周

相关文章：

html - 使用 CSS 在表格单元格中显示高度百分比

jquery - 使用 JQuery 查找索引与计数变量匹配的项目

ruby-on-rails - Ruby on Rails - Base64 的外部图像 Url

ruby-on-rails - RSPEC 未定义方法 'jobs' 为 nil :NilClass (ruby on rails)

ruby-on-rails - Travis CI "rake db:migrate"或 "rake db:test:prepare"导致 rake 中止! PG::错误:错误:关系 "settings"不存在

arrays - Ruby 数组哈希值问题

image - 将多个图像保存为视频格式的可能性？

ruby-on-rails - Rails collection_check_boxes 中的多个列名/自定义标签

ruby-on-rails - 仅当可搜索字段发生变化时才使用太阳黑子索引

ruby-on-rails - Rake 测试错误 - ActiveRecord::Fixture::FormatError: ActiveRecord::Fixture::FormatError