regex - Perl6 中的语法有点过于贪婪

我遇到了这个迷你语法的问题，它试图匹配类似 Markdown 的 header 结构。

role Like-a-word {
    regex like-a-word { \S+ }
}

role Span does Like-a-word {
    regex span { <like-a-word>[\s+ <like-a-word>]* } 
}
grammar Grammar::Headers does Span {
    token TOP {^ <header> \v+ $}

    token hashes { '#'**1..6 }

    regex header {^^ <hashes> \h+ <span> [\h* $0]? $$}
}

我希望它匹配 ## Easier ##作为标题，但取而代之的是 ##作为 span 的一部分:

TOP
|  header
|  |  hashes
|  |  * MATCH "##"
|  |  span
|  |  |  like-a-word
|  |  |  * MATCH "Easier"
|  |  |  like-a-word
|  |  |  * MATCH "##"
|  |  |  like-a-word
|  |  |  * FAIL
|  |  * MATCH "Easier ##"
|  * MATCH "## Easier ##"
* MATCH "## Easier ##\n"
｢## Easier ##
｣
 header => ｢## Easier ##｣
  hashes => ｢##｣
  span => ｢Easier ##｣
   like-a-word => ｢Easier｣
   like-a-word => ｢##｣

问题在于[\h* $0]?似乎根本不起作用，使用 span吞噬所有可用的单词。任何的想法？

最佳答案

首先，正如其他人所指出的，<hashes>不捕获到 $0 ，而是捕获到 $<hashes> 中，所以你必须写:

regex header {^^ <hashes> \h+ <span> [\h* $<hashes>]? $$}

但这仍然不符合您想要的方式，因为 [\h* $<hashes>]?部分愉快地匹配零次出现。

正确的解决方法是不让 span匹配 ##一句话:

role Like-a-word {
    regex like-a-word { <!before '#'> \S+ }
}

role Span does Like-a-word {
    regex span { <like-a-word>[\s+ <like-a-word>]* } 
}
grammar Grammar::Headers does Span {
    token TOP {^ <header> \v+ $}

    token hashes { '#'**1..6 }

    regex header {^^ <hashes> \h+ <span> [\h* $<hashes>]? $$}
}

say Grammar::Headers.subparse("## Easier ##\n", :rule<header>);

如果您不愿意修改 like-a-word ，您还可以强制排除最终的 #像这样:

role Like-a-word {
    regex like-a-word { \S+ }
}

role Span does Like-a-word {
    regex span { <like-a-word>[\s+ <like-a-word>]* } 
}
grammar Grammar::Headers does Span {
    token TOP {^ <header> \v+ $}

    token hashes { '#'**1..6 }

    regex header {^^ <hashes> \h+ <span> <!after '#'> [\h* $<hashes>]? $$}
}

say Grammar::Headers.subparse("## Easier ##\n", :rule<header>);

关于regex - Perl6 中的语法有点过于贪婪，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48110245/

regex - Perl6 中的语法有点过于贪婪

上一篇：r - 使用 ggplot2 时，我可以设置直方图条的颜色而不会掩盖低值吗？

下一篇：r - 具有自定义 bin 边缘的 ggplot2 密度直方图