我正在尝试从 EBML 定义中提取所有匹配项,如下所示:
| + A track
| + Track number: 3
| + Track UID: 724222477
| + Track type: subtitles
...
| + Language: eng
...
| + A track
| + Track number: 4
| + Track UID: 745646561
| + Track type: subtitles
...
| + Language: jpn
...
我想要所有出现的“Language: ???”当前面有“轨道类型:字幕”时。我尝试了几种变体:
Track type: subtitles.*Language: (\w\w\w)
我在 Ruby 中使用多行修饰符,因此它匹配换行符(就像其他语言中的“s”修饰符)。
这可以得到最后的出现,在上面的例子中,它是'jpn',例如:
string.scan(/Track type: subtitles.*Language: (\w\w\w)/m)
=> [["jpn"]]
我想要的结果:
=> [["eng"], ["jpn"]]
完成此操作的正确正则表达式是什么?
最佳答案
你需要通过改变这个来让你的正则表达式是非贪婪的:
.*
对此:
.*?
您的正则表达式匹配从第一次出现的 Track type: subtitles
到最后一次出现的 Language: (\w\w\w)
。让它成为非贪婪的会起作用,因为它匹配尽可能少的字符。
关于ruby - 当前面有特定字符串时,如何找到所有出现的字符序列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/266997/