ruby - 在 Ruby 中使用正则表达式提取两个标签之间的文本

标签 ruby regex

假设我有这个包含 html 标签的字符串:

<a href="abgeordnete-1128-0----w8397.html" class="small_link">Berlin-Treptow-Köpenick</a>

如何在 ruby​​ 中使用正则表达式来提取“Berlin-Treptow-Köpenick”的文本?

谢谢! :)

最佳答案

您可以使用:

html = '<a href="abgeordnete-1128-0----w8397.html" class="small_link">Berlin-Treptow-Köpenick</a>'

html[/>(.*)</, 1]
#=> "Berlin-Treptow-Köpenick"

当您的 HTML 部分更复杂时,我建议使用像 Nokogiri 这样的库:

html = '<a href="abgeordnete-1128-0----w8397.html" class="small_link">Berlin-Treptow-Köpenick</a>'

require 'nokogiri'

Nokogiri::HTML(html).text
#=> "Berlin-Treptow-Köpenick"
         

关于ruby - 在 Ruby 中使用正则表达式提取两个标签之间的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33988226/

相关文章:

ruby - 什么是一些基于Ruby的优秀Web搜寻器?

arrays - 如何将嵌套数组转换为散列或 JSON 值作为数组

ruby-on-rails - Rails Streamio FFMPEG 截取电影并使用carrierwave上传

Ruby:测试未​​运行

regex - Eclipse 的搜索和替换中的匹配组语法是什么

java - 正则表达式从任意货币格式中提取美分值

java - 如何仅在分隔符之间提取数字?

java - 正则表达式:匹配其他正则表达式剩下的所有内容

c++ - Qt - 如何在 QString 中定义正则表达式

ruby - 区分大小写的替换