ruby - 如何使用 Ruby 和 Nokogiri 解析 Google 图片 URL?

标签 ruby regex rubygems nokogiri

我正在尝试制作一个包含 Google 图片网页上所有图片文件的数组。

我想要一个正则表达式来提取 "imagurl=" 之后并在 "&" 之前结束的所有内容,如以下 HTML 所示:

<a href="http://www.google.com/imgres?imgurl=http://www.trendytree.com/old-world-   christmas/images/20031chapel20031-silent-night-chapel.jpg&amp;imgrefurl=http://www.trendytree.com/old-world-christmas/silent-night-chapel-20031-christmas-ornament-old-world-christmas.html&amp;usg=__YJdf3xc4ydSfLQa9tYnAzavKHYQ=&amp;h=400&amp;w=400&amp;sz=58&amp;hl=en&amp;start=19&amp;zoom=1&amp;tbnid=ajDcsGGs0tgE9M:&amp;tbnh=124&amp;tbnw=124&amp;ei=qagfUbXmHKfv0QHI3oG4CQ&amp;itbs=1&amp;sa=X&amp;ved=0CE4QrQMwEg"><img height="124" width="124" src="https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcRLy5inpSdHxWuE7z3QSZw35JwN3upbBaLr11LR25noTKbSMn9-qrySSg"></a><br><cite title="trendytree.com">trendytree.com</cite><br>Silent Night Chapel <b>20031</b><br>400 × 400 - 58k - jpg</td>

我觉得我可以使用正则表达式来做到这一点,但我找不到使用正则表达式搜索已解析文档的方法,而且我没有找到任何解决方案。

最佳答案

str = '<a href="http://www.google.com/imgres?imgurl=http://www.trendytree.com/old-world-     christmas/images/20031chapel20031-silent-night-chapel.jpg&amp;imgrefurl=http://www.trendytree.com/old-world-christmas/silent-night-chapel-20031-christmas-ornament-old-world-christmas.html&amp;usg=__YJdf3xc4ydSfLQa9tYnAzavKHYQ=&amp;h=400&amp;w=400&amp;sz=58&amp;hl=en&amp;start=19&amp;zoom=1&amp;tbnid=ajDcsGGs0tgE9M:&amp;tbnh=124&amp;tbnw=124&amp;ei=qagfUbXmHKfv0QHI3oG4CQ&amp;itbs=1&amp;sa=X&amp;ved=0CE4QrQMwEg"><img height="124" width="124" src="https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcRLy5inpSdHxWuE7z3QSZw35JwN3upbBaLr11LR25noTKbSMn9-qrySSg"></a><br><cite title="trendytree.com">trendytree.com</cite><br>Silent Night Chapel <b>20031</b><br>400 × 400 - 58k - jpg</td>'
str.split('imgurl=')[1].split('&amp')[0]
#=> "http://www.trendytree.com/old-world-     christmas/images/20031chapel20031-silent-night-chapel.jpg"

这就是你要找的吗?

关于ruby - 如何使用 Ruby 和 Nokogiri 解析 Google 图片 URL?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14912392/

相关文章:

ruby - 对ruby的变量和方法感到困惑

ruby-on-rails - 确定 ruby​​ 循环中的 json 键/值何时需要逗号?

c# - 子字符串替换的问题

ruby-on-rails - 如何使用包含 activerecord 模型的 gem 设置 RSpec?

ruby - ruby安装错了吗?

ruby-on-rails - 如何从任何文件夹查看 Rails 中的文件列表,外部 Rails.root - Windows

ruby - 将数据写入文件的最有效方法

python - 使用 Python 和正则表达式查找字符串中的所有中文文本

jquery - jquery 正则表达式 字母数字

ruby - 如何安全修复 webrobots-0.0.10.gemspec 的 "invalid date format in specification"