c# - 按 unicode 类别拆分字符串

标签 c# string c#-4.0 unicode split

我有一个包含许多不同字符的字符串,我希望能够将字符串拆分为 unicode 中 [Po] 类别中的所有字符。

我怎样才能轻松地做到这一点(即我想避免枚举此列表中的所有字符,然后创建一个巨大的字符数组,然后按它拆分)?我还可以想象,这些字符的存储方式有一些共同的属性,可以使这更容易。

那么,我怎样才能用所有 unicode 标点符号拆分一个字符串呢?

最佳答案

Po 类别是 supported by the .NET regular expression engine , 所以你可以简单地这样做:

Regex.Split("this,is.a!test", @"\p{Po}") // [ "this", "is", "a", "test" ]

关于c# - 按 unicode 类别拆分字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17751402/

相关文章:

c# - 在 C# 中将类似 java 的日期字符串转换为 DateTime

c# - C# 中的 .Net/Mono Singleton(服务/服务器?) - 检测我的 .net 应用程序是否已在运行并将命令行参数传递给它

c# - C# 中的命名参数和 params 关键字

javascript - 循环遍历字符串

c# - 嵌套接口(interface)和抽象实现类

c# - 禁用将项目添加到集合

php - 截断字符串,但删除字符串的中间而不是结尾

c - 从文件 C 中读取并跳转行

linq - ef cf linq 填充被忽略的属性

c# - 排序列表而不创建新变量