ruby-on-rails - 如何使用 Mechanize gem 抓取图像的图标链接

标签 ruby-on-rails ruby web-scraping ruby-on-rails-5 mechanize

我有一个网址,我必须在那里所有图像使用 mechanize gem,但一些图片网址在 rel=icon 中.
我必须从这个 url 获取图像:

<link rel="icon" href="https://mywebsite.com/wp-content/uploads/2021/10/cropped-favicon-32x32.png" sizes="32x32">
这是我试过的代码 擦伤 只有图像。如何让两者合而为一。
require 'mechanize'
url = "https://mywebsite.com/"

agent = Mechanize.new
page = agent.get(url)

page.images.each do |image|
  puts image #getting here all images here from image tag
end

最佳答案

我看了Mechanize Page Link但它只返回 anchors .
xpath 试过了

page.xpath('//link[contains(@rel, "icon")]').each do |icon|
  p icon.attr('href')
end
并收到:
"https://ownwebsite.com/wp-content/uploads/2021/10/cropped-favicon-32x32.png"
"https://ownwebsite.com/wp-content/uploads/2021/10/cropped-favicon-192x192.png" 
"https://ownwebsite.com/wp-content/uploads/2021/10/cropped-favicon-180x180.png"
这是一个 Replit返回所有图像。

关于ruby-on-rails - 如何使用 Mechanize gem 抓取图像的图标链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70061983/

相关文章:

ruby - Ruby-Elastic Search和RabbitMQ-数据导入丢失,脚本无提示崩溃

ruby - FileUtils 更新了吗? Ruby 中的问题

python - 从任意嵌套的 HTML 中提取所有文本

ruby-on-rails - group_by 之后的 ruby​​ on rails 求和字段

ruby-on-rails - 如何在 Rails 3 中为日期字段编写 inclusion_of 验证器?

ruby-on-rails - 使用 curl 测试 Rails 路由

javascript - puppeteer:从 NodeList 获取 HTML?

python - 如何使用美汤获取谷歌财经某只股票的当前价格?

ruby-on-rails - 访问哈希元素时未定义的方法

ruby-on-rails - 查询未命中索引 - 这些列是否适合索引?