ruby - 使用 Ruby 拆分 Unicode 字符串

标签 ruby unicode

如何在 Ruby 中按 Unicode 范围 拆分字符串。我想用逗号在\u1000 下和\u1000 上分开。例如,我想拆分这个字符串...

I love ျမန္မာ

对于这个...

I love, ျမန္မာ

您可能看不到我示例中的 Unicode 字符。它是 Unicode 范围\u1000 及以上。

谢谢。

最佳答案

取决于您使用的是哪个版本;这是 1.9 的解决方案。我想 1.8 会变得丑陋。

这不太优雅,但似乎有效。

"I love ျမန္မာ".gsub(/([\u0000-\u0999])([\u1000-\u9999])/, '\1,\2')

如果这种方法合适,你必须提供另一种情况(高到低转换)

关于ruby - 使用 Ruby 拆分 Unicode 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1619788/

相关文章:

java - 无法解析包含中文内容的 XML 文件

ruby - 调用父类的初始化函数?

Ruby - 正确处理空对象

javascript - 将 javascript 行添加到以 slim 编写的 ruby​​ 站点

unicode - 日文双字节 Unicode 标题标签

delphi - 我何时以及为什么应该使用 TStringBuilder?

ruby-on-rails - 使用 Ruby on Rails 格式化日期

ruby - 用 ruby​​ 删除文件的前两行

c++ - 如何在 QString/QDebug 中使用 Unicode 字符?

python - 编码期间出现 UnicodeDecodeError?