我需要从下面列出的 html 中提取实际的电话号码,但我不确定如何使用 Nokogiri CSS 来完成它,因为它周围没有 html 标签。当 at_css(.phonetitle) 时,它只解析电话而不解析号码。
<div class="detail">
<span class="address">Corner of Toorak Road and Chapel Street, South Yarra</span><br>
<span class="phonetitle">Phone</span> 95435 34341
<br><br>
</div>
最佳答案
没有一点 XPath 无法处理的:
#!/usr/bin/env ruby
require 'nokogiri'
doc = Nokogiri::HTML(<<-HERE)
<div class="detail">
<span class="address">
Corner of Toorak Road and Chapel Street, South Yarra
</span><br>
<span class="phonetitle">Phone</span> 95435 34341
<br><br>
</div>
HERE
puts doc.search('*[@class="detail"]/text()').text.strip
# => 95435 34341
关于html - 解析没有 HTML 标签的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2482325/