我正在尝试识别和处理文本中的和弦符号。在这样做的过程中,我最终尝试匹配一组重复模式,但只有最后一个匹配的实例出现在返回的数组中。
"Amaj13#11".match(/([a-g][#|b]?)(?:(maj|m|sus|dim|#|b)?(\d+))*/i)
// Expected
["Amaj13#11", "A", "maj", "13", "#", "11"]
// Actual
["Amaj13#11", "A", "#", "11"]
应该捕获其他术语的组是:(?:(maj|m|sus|dim|#|b)?(\d+))*
。
据我了解,这是因为没有全局标志不存在,当我添加它时,它会正确提取并匹配正确的部分并返回字符串 "Amaj13#11"
,这表明回到正题。
我如何使用全局标志并将返回的组件放入数组中,或者在没有它的情况下重复捕获组?
一些示例输入和所需的输出。
"C#m9#5" // ["C#", "m", "9", "#", "5"]
"Bsus2" // ["B", "sus", "2"]
"Db#11" // ["Db", "#", "11"]
"Fmaj6b2" // ["F", "maj", "6", "b", "2"]
最佳答案
这是一个有趣的问题,因为虽然它似乎挑战 javascript,但它有一个简单的答案。
我建议的方法是忘记捕获组并尝试拆分。但是 Javascript 没有 lookbehinds(在指定分割分隔符时很有用),据我所知,它没有像 PHP 那样分割字符串并保留分隔符的选项。这使我们采用了两步法。
第一步:决定我们要分割的地方。根据您所说的,听起来我们正在研究一个简单的正则表达式,例如
[A-Gb#]|(?:maj|sus)|\d+
请修改它以满足您的需要。
第二步:在分割点插入标记。为此,我们使用替换:
readyToSplit = str.replace(/([A-Gb#]|(?:maj|sus)|\d+)/mg, "$1[SPLIT]");
这给了我们:
A[SPLIT]maj[SPLIT]13[SPLIT]#[SPLIT]11[SPLIT]
第三步:拆分。
result = readyToSplit.split(/\[SPLIT\]/m);
这给了我们:A
、maj
、13
、#
、11
您可能需要调整 token ,但这是一般的想法。
关于javascript - 正则表达式:没有全局标志的重复捕获组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23567743/