我有一个网址,我必须在那里刮 所有图像使用 mechanize
gem,但一些图片网址在 rel=icon
中.
我必须从这个 url 获取图像:
<link rel="icon" href="https://mywebsite.com/wp-content/uploads/2021/10/cropped-favicon-32x32.png" sizes="32x32">
这是我试过的代码 擦伤 只有图像。如何让两者合而为一。require 'mechanize'
url = "https://mywebsite.com/"
agent = Mechanize.new
page = agent.get(url)
page.images.each do |image|
puts image #getting here all images here from image tag
end
最佳答案
我看了Mechanize Page Link但它只返回 anchors
.
用 xpath
试过了
page.xpath('//link[contains(@rel, "icon")]').each do |icon|
p icon.attr('href')
end
并收到:"https://ownwebsite.com/wp-content/uploads/2021/10/cropped-favicon-32x32.png"
"https://ownwebsite.com/wp-content/uploads/2021/10/cropped-favicon-192x192.png"
"https://ownwebsite.com/wp-content/uploads/2021/10/cropped-favicon-180x180.png"
这是一个 Replit返回所有图像。
关于ruby-on-rails - 如何使用 Mechanize gem 抓取图像的图标链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70061983/