如何在 Ruby 中按 Unicode 范围 拆分字符串。我想用逗号在\u1000 下和\u1000 上分开。例如,我想拆分这个字符串...
I love ျမန္မာ
对于这个...
I love, ျမန္မာ
您可能看不到我示例中的 Unicode 字符。它是 Unicode 范围\u1000 及以上。
谢谢。
最佳答案
取决于您使用的是哪个版本;这是 1.9 的解决方案。我想 1.8 会变得丑陋。
这不太优雅,但似乎有效。
"I love ျမန္မာ".gsub(/([\u0000-\u0999])([\u1000-\u9999])/, '\1,\2')
如果这种方法合适,你必须提供另一种情况(高到低转换)
关于ruby - 使用 Ruby 拆分 Unicode 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1619788/