ruby - 获取字符串的含义

标签 ruby string encoding

我有以下字符串“\u3048\u3075\u3057\u3093”。我得到了字符串 来自网页作为 JSONP 返回数据的一部分。

那是什么?它看起来像 UTF8,但它应该看起来像 "U+3048U+3075U+3057U+3093" 吗?

反斜杠 (\) 的含义是什么?

如何将其转换为人类可读的形式?

我正在寻找 Ruby 的解决方案,但对这里发生的情况的任何解释都值得赞赏。

最佳答案

U+3048 语法通常用于表示字符的 Unicode 代码点。这样的代码点是固定的,不依赖于编码(UTF-8、UTF-32...)。

JSON 字符串由除双引号、反斜杠和 U+0000 到 U+001F 范围内的字符(控制字符)之外的 Unicode 字符组成。字符可以用以 \u 开头并后跟代表字符的 Unicode 代码点的 4 个十六进制数字的转义序列来表示。这是 JavaScript 语法(JSON 是它的子集)。在 JavaScript 中,反斜杠用作转义字符。

关于ruby - 获取字符串的含义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3184412/

相关文章:

ruby - 在RSpec中,stub!有什么区别? stub ?

java - 在模式上分割字符串首先出现,如 ";;;"在 Post Java 中解释?

c - 空终止错误在哪里?

java - 检查字符串是否是用 Java 编码的有效 UTF-8

cocoa - NSTask字符串编码问题

Ruby:为什么 Array.sort 对大对象很慢?

ruby - 如何在 Ruby 类中使​​用 if 语句?

ruby-on-rails - 将应用程序部署到两个不同的服务器,具有不同的 production.rb 内容

c# - Convert.ToDouble 和 double.Parse 与 InvariantCulture 的区别

node.js - Node 缓冲区,从 utf8 到二进制