如何使用 Regex.Split 拆分字符串并保留所有分隔符?
我有一个 string:"substring1 delimeter1 substring2",其中 delimeter+substring2 是地址的一部分。
我还有 2 个和更多的分隔符:delim1,delim2 意思是等价的;
我想得到这样的字符串数组:
arr[0]="subsctring1";
arr[1]="delim1 subsctring2";
或者,
arr[1]="delim2 subsctring2;
我有一个模式:
addrArr= Regex.Split(inputText, String.Concat("(?<=",delimeter1, "|",delimeter2, ")"), RegexOptions.None);
但效果不是很好。
你能帮我创建一个有效的模式吗?
最佳答案
您需要一个仅具有前瞻性的模式:
\s+(?=delim1|delim2)
\s+
将匹配 1 个或多个空格(因为您的字符串包含空格)。如果不能有空格,请使用 \s*
(但是您需要从结果中删除空条目)。查看regex demo .如果这些分隔符必须是整个单词,请使用 \b
单词边界:\s+(?=\b(?:delim1|delim2)\b)
。
在 C# 中:
addrArr = Regex.Split(inputText, string.Format(@"\s+(?={0})", string.Join("|", delimeters)));
如果分隔符可以包含特殊的正则表达式元字符,您将需要在 delimiters
列表上运行 Regex.Escape
。
A C# demo :
var inputText = "substring1 delim1 substring2 delim2 substr3";
var delimeters = new List<string> { "delim1", "delim2" };
var addrArr = Regex.Split(inputText,
string.Format(@"\s+(?={0})", string.Join("|", delimeters.Select(Regex.Escape))));
Console.WriteLine(string.Join("\n", addrArr));
关于c# - 如何使用 Regex.Split 拆分字符串并保留所有分隔符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40342424/