html - 解析没有 HTML 标签的数据

标签 html css ruby parsing nokogiri

我需要从下面列出的 html 中提取实际的电话号码,但我不确定如何使用 Nokogiri CSS 来完成它,因为它周围没有 html 标签。当 at_css(.phonetitle) 时,它只解析电话而不解析号码。

<div class="detail">
    <span class="address">Corner of Toorak Road and Chapel Street, South Yarra</span><br>
    <span class="phonetitle">Phone</span> 95435 34341
    <br><br>
</div>

最佳答案

没有一点 XPath 无法处理的:

#!/usr/bin/env ruby
require 'nokogiri'

doc = Nokogiri::HTML(<<-HERE)
  <div class="detail">
    <span class="address">
      Corner of Toorak Road and Chapel Street, South Yarra
    </span><br>
    <span class="phonetitle">Phone</span> 95435 34341
    <br><br>
  </div>
HERE

puts doc.search('*[@class="detail"]/text()').text.strip
# => 95435 34341

关于html - 解析没有 HTML 标签的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2482325/

相关文章:

html - 浏览器如何理解我们使用的命名空间?

javascript - 在背景中缩放图片,站点引用

javascript - 外部JS代码

javascript - 使用 div.style.display "block": "none" to hide/unhide based on 2 checkboxes

arrays - ruby 是否支持可枚举的 map_cons 方法或其等效方法?

ruby-on-rails - 在 ruby​​ on Rails 中单击按钮时调用操作

ruby-on-rails - Rails 3.2 `link_to`(在电子邮件中) `method: :put` 仍在生成 GET 请求

html - JSF bootstrap Glyphicons 不显示

html - 如何使此左侧边栏在移动设备上可见?

html - 如何删除 Bootstrap 中列之间的装订线(间距)?