如何使用 Mechanize 或 Nokogiri 从当前页面提取特定图像的 src 参数?
图像在类似这样的东西里面:
<div class="aaa">
<div id="bbb">
<div class="pp">
<img src="/user/photo/photo01" alt="photo">
</div>
</div>
</div>
这是我正在尝试的:
agent = ::Mechanize.new
agent.get ("some html url page")
doc = Nokogiri::HTML(open(agent.page.uri.to_s))
@result = doc.css('img')
感谢任何帮助。
最佳答案
以下将打印 .aaa
和 #bbb
div 中每个 a
标签的 src
属性:
html = %Q{
<div class="aaa">
<div id="bbb">
<div class="pp">
<img src="/user/photo/photo01" alt="photo">
</div>
</div>
</div>
}
doc = Nokogiri(html)
doc.search('.aaa #bbb img').each |link|
puts link.attr('src')
end
关于ruby-on-rails - Mechanize 从 HTML 中提取图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30040925/