我有一个 super 英雄字符串,所有他们都有名字,但不是所有他们都有属性。
它的格式为⛦name⛯attrName☾attrData☽
,其中attrName☾attrData☽
是可选的。
所以,superheroes 字符串是:
⛦超人⛯衬衫☾blue☽⛦ clown ⛯⛦蜘蛛侠⛯age☾15岁☽girlFriend☾Cindy☽
我想使用 Regex 提取字符串,并将结果填充到 map slice 中,如下所示:
[ {name: superman, shirt: blue},
{name: joker},
{name: spiderman, age: 15yo, girlFriend: Cindy} ]
我无法在 Go playground 中完成它。我使用正则表达式⛦(\\w+)⛯(?:(\\w+)☾(\\w+)☽)*
,但它只能捕获单个属性,即正则表达式无法捕获age
属性。
我的代码是:
func main() {
re := regexp.MustCompile("⛦(\\w+)⛯(?:(\\w+)☾(\\w+)☽)*")
fmt.Printf("%q\n", re.FindAllStringSubmatch("⛦superman⛯shirt☾blue☽⛦joker⛯⛦spiderman⛯age☾15yo☽girlFriend☾Cindy☽", -1))
}
Go Playground 代码在这里:https://play.golang.org/p/Epv66LVwuRK
运行结果为:
[
["⛦superman⛯shirt☾blue☽" "superman" "shirt" "blue"]
["⛦joker⛯" "joker" "" ""]
["⛦spiderman⛯age☾15yo☽girlFriend☾Cindy☽" "spiderman" "girlFriend" "Cindy"]
]
缺少年龄
,知道吗?
最佳答案
您不能使用单个捕获组捕获任意数量的子字符串。您需要先匹配整个记录,然后再用另一个正则表达式匹配它的子部分。
看一个例子:
package main
import (
"fmt"
"regexp"
)
func main() {
str := "⛦superman⛯shirt☾blue☽⛦joker⛯⛦spiderman⛯age☾15yo☽girlFriend☾Cindy☽"
re_main := regexp.MustCompile(`⛦(\w+)⛯((?:\w+☾\w+☽)*)`)
re_aux := regexp.MustCompile(`(\w+)☾(\w+)☽`)
for _, match := range re_main.FindAllStringSubmatch(str, -1) {
fmt.Printf("%v\n", match[1])
for _, match_aux := range re_aux.FindAllStringSubmatch(match[2], -1) {
fmt.Printf("%v: %v\n", match_aux[1], match_aux[2])
}
fmt.Println("--END OF MATCH--")
}
}
参见 Go demo
输出:
superman
shirt: blue
--END OF MATCH--
joker
--END OF MATCH--
spiderman
age: 15yo
girlFriend: Cindy
--END OF MATCH--
在这里,⛦(\w+)⛯((?:\w+☾\w+☽)*)
是主要的正则表达式,它匹配并捕获到组 1 中的主要“键”和字符串其他键值被捕获到第 2 组。然后,您需要迭代找到的匹配项,并使用 (\w+)☾(\w+)☽
从第 2 组收集所有键值>.
关于regex - 带有 FindAllStringSubmatch 的 Golang 复杂正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52725176/