ruby - 获取标签后的文本,包含另一个文本

标签 ruby regex parsing xpath nokogiri

例如:

<p>
<b>Member Since:</b> Aug. 07, 2010<br><b>Time Played:</b> <span class="text_tooltip" title="Actual Time: 15.09:37:06">16 days</span><br><b>Last Game:</b>
<span class="text_tooltip" title="07/16/2011 23:41">1 minute ago</span>
<br><b>Wins:</b> 1,017<br><b>Losses / Quits:</b> 883 / 247<br><b>Frags / Deaths:</b> 26,955 / 42,553<br><b>Hits / Shots:</b> 690,695 / 4,229,566<br><b>Accuracy:</b> 16%<br>
</p>

我想得到 1,017 .它是标记后的文本,包含文本 Wins: .
如果我使用正则表达式,它将是 [/<b>Wins:<\/b> ([^<]+)/,1] ,但是如何使用 Nokogiri 和 XPath 来实现呢? 还是我应该用正则表达式更好地解析这部分页面?

最佳答案

这里

doc = Nokogiri::HTML(html)
puts doc.at('b[text()="Wins:"]').next.text

关于ruby - 获取标签后的文本,包含另一个文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6722314/

相关文章:

regex - Regex_Extract使用PIG

python - 为什么我只得到第一个元素?

javascript - D3 折线图的解析日期 "2013-07-11T00:00:00"

ruby-on-rails - 是否有用于使用 JSON-API 格式的 RESTful json api 的 gem? Rails 上的 Ruby

ruby - 奇怪的 Ruby If 语句问题

ruby-on-rails - 在 Rails View 中检查 nil 字符串

python - 为什么 python 正则表达式这么慢?

ruby - 将哈希数组转换为哈希哈希,由哈希的属性索引

javascript - 正则表达式仅数字,破折号是可选的

node.js - Timex3 日期时间解析和转换