regex - 带有 FindAllStringSubmatch 的 Golang 复杂正则表达式

标签 regex go

我有一个 super 英雄字符串,所有他们都有名字,但不是所有他们都有属性。

它的格式为⛦name⛯attrName☾attrData☽,其中attrName☾attrData☽是可选的。

所以,superheroes 字符串是:

⛦超人⛯衬衫☾blue☽⛦ clown ⛯⛦蜘蛛侠⛯age☾15岁☽girlFriend☾Cindy☽

我想使用 Regex 提取字符串,并将结果填充到 map slice 中,如下所示:

[ {name: superman, shirt: blue},
  {name: joker},
  {name: spiderman, age: 15yo, girlFriend: Cindy} ]

我无法在 Go playground 中完成它。我使用正则表达式⛦(\\w+)⛯(?:(\\w+)☾(\\w+)☽)*,但它只能捕获单个属性,即正则表达式无法捕获age 属性。

我的代码是:

func main() {
    re := regexp.MustCompile("⛦(\\w+)⛯(?:(\\w+)☾(\\w+)☽)*")
    fmt.Printf("%q\n", re.FindAllStringSubmatch("⛦superman⛯shirt☾blue☽⛦joker⛯⛦spiderman⛯age☾15yo☽girlFriend☾Cindy☽", -1))
}

Go Playground 代码在这里:https://play.golang.org/p/Epv66LVwuRK

运行结果为:

[
    ["⛦superman⛯shirt☾blue☽" "superman" "shirt" "blue"]
    ["⛦joker⛯" "joker" "" ""]
    ["⛦spiderman⛯age☾15yo☽girlFriend☾Cindy☽" "spiderman" "girlFriend" "Cindy"]
]

缺少年龄,知道吗?

最佳答案

您不能使用单个捕获组捕获任意数量的子字符串。您需要先匹配整个记录,然后再用另一个正则表达式匹配它的子部分。

看一个例子:

package main

import (
    "fmt"
    "regexp"
)

func main() {

    str := "⛦superman⛯shirt☾blue☽⛦joker⛯⛦spiderman⛯age☾15yo☽girlFriend☾Cindy☽"

    re_main := regexp.MustCompile(`⛦(\w+)⛯((?:\w+☾\w+☽)*)`)
    re_aux := regexp.MustCompile(`(\w+)☾(\w+)☽`)
    for _, match := range re_main.FindAllStringSubmatch(str, -1) {
        fmt.Printf("%v\n", match[1])
        for _, match_aux := range re_aux.FindAllStringSubmatch(match[2], -1) {      
            fmt.Printf("%v: %v\n", match_aux[1], match_aux[2])
        }
        fmt.Println("--END OF MATCH--") 
    }  
}

参见 Go demo

输出:

superman
shirt: blue
--END OF MATCH--
joker
--END OF MATCH--
spiderman
age: 15yo
girlFriend: Cindy
--END OF MATCH--

在这里,⛦(\w+)⛯((?:\w+☾\w+☽)*) 是主要的正则表达式,它匹配并捕获到组 1 中的主要“键”和字符串其他键值被捕获到第 2 组。然后,您需要迭代找到的匹配项,并使用 (\w+)☾(\w+)☽ 从第 2 组收集所有键值>.

关于regex - 带有 FindAllStringSubmatch 的 Golang 复杂正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52725176/

相关文章:

用于删除引用的正则表达式

Javascript:使用正则表达式来分割和存储?

java - 使用正则表达式替换不在括号中的逗号

google-app-engine - 在 App Engine Standard 上进行销售

pointers - 通过引用传递自定义 slice 类型

go - 我可以向 Visual Studio Team Services 添加 Golang 编译器吗

java - 正则表达式,如何识别由空格分隔的 2 或 3 个单词(任何非空格)

regex - Perl 正则表达式的 'o' 修饰符是否仍然提供任何好处?

mongodb - 使用结构 slice 更新文档

go - goroutine 在创建 channel 时如何表现