ruby - 如何使用 Nokogiri 从 HTML 解析多个字符串?

标签 ruby nokogiri

我需要使用 Nokogiri 解析此 HTML 代码,但将“Piso en Calle Antonio Pascual”保存在一个变量中,将“Peñiscola”保存在另一个变量中。

<h1 class="title g13_24">
        Piso en  Calle Antonio Pascual
        <span class="title-extra-info">Peñíscola</span>
</h1>

最佳答案

require 'nokogiri'
doc = Nokogiri::HTML.parse(<<-HTML)
  <h1 class="title g13_24">
    Piso en  Calle Antonio Pascual
    <span class="title-extra-info">Peñíscola</span>
  </h1>
HTML

h1 = doc.at_css('h1.title')
str1 = h1.children[0].text.strip
# => "Piso en  Calle Antonio Pascual"
str2 = h1.at_css('.title-extra-info').text.strip
# => "Peñíscola"

但坦率地说,Nokogiri 文档也会告诉您相同的信息。

关于ruby - 如何使用 Nokogiri 从 HTML 解析多个字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9386484/

相关文章:

ruby-on-rails - 如何使用法拉第模拟 rspec 中的请求超时

ruby - 带有 :after css selector 的 nokogiri

xml - 如何使用 Nokogiri Builder 创建带有命名空间根元素的 XML 文档

html - Ruby Nokogiri 提取 HTML 选项卡值

ruby-on-rails - 使用 CarrierWave 上传 RESTful 文件

ruby 类扩展

arrays - 匹配Array中的多个条件#reject

ruby-on-rails - 比较 Ruby on Rails 中的时间和日期时间?

ruby - Ruby 和 JRuby 中的 XSLT 转换

ruby - 使用 net-http-digest_auth 的未知算法 MD5