ruby - 当前面有特定字符串时,如何找到所有出现的字符序列?

标签 ruby regex

我正在尝试从 EBML 定义中提取所有匹配项,如下所示:

| + A track
|  + Track number: 3
|  + Track UID: 724222477
|  + Track type: subtitles
...
|  + Language: eng
...
| + A track
|  + Track number: 4
|  + Track UID: 745646561
|  + Track type: subtitles
...
|  + Language: jpn
...

我想要所有出现的“Language: ???”当前面有“轨道类型:字幕”时。我尝试了几种变体:

Track type: subtitles.*Language: (\w\w\w)

我在 Ruby 中使用多行修饰符,因此它匹配换行符(就像其他语言中的“s”修饰符)。

这可以得到最后的出现,在上面的例子中,它是'jpn',例如:

string.scan(/Track type: subtitles.*Language: (\w\w\w)/m)
=> [["jpn"]]

我想要的结果:

=> [["eng"], ["jpn"]]

完成此操作的正确正则表达式是什么?

最佳答案

你需要通过改变这个来让你的正则表达式是非贪婪的:

.*

对此:

.*?

您的正则表达式匹配从第一次出现的 Track type: subtitles 到最后一次出现的 Language: (\w\w\w)。让它成为非贪婪的会起作用,因为它匹配尽可能少的字符。

关于ruby - 当前面有特定字符串时,如何找到所有出现的字符序列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/266997/

相关文章:

ruby-on-rails - 如何指定 Devkit 的路径?

ruby - 警告解析器/当前正在加载解析器/ruby22

javascript - 在 javascript 中使用 C# 正则表达式

java - 新加坡地址的正则表达式

json - Apache NiFi 拆分 JSON 根数组

ruby -/etc/irbrc 是 OS X 安装的吗? irb 读了吗?

ruby-on-rails - $ bundle exec rake db :reset command raising couldn't drop db/development. sqlite3

ruby-on-rails - 来自 URL 的 Ruby on Rails 和 JSON 解析器

Javascript:更改哈希的特定部分

regex - 关于正则表达式的证明