我有一个包含许多不同字符的字符串,我希望能够将字符串拆分为 unicode 中 [Po] 类别中的所有字符。
我怎样才能轻松地做到这一点(即我想避免枚举此列表中的所有字符,然后创建一个巨大的字符数组,然后按它拆分)?我还可以想象,这些字符的存储方式有一些共同的属性,可以使这更容易。
那么,我怎样才能用所有 unicode 标点符号拆分一个字符串呢?
最佳答案
Po
类别是 supported by the .NET regular expression engine , 所以你可以简单地这样做:
Regex.Split("this,is.a!test", @"\p{Po}") // [ "this", "is", "a", "test" ]
关于c# - 按 unicode 类别拆分字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17751402/