当使用 apt 安装/从源代码编译时，R 会以不同方式处理某些字符

来自 Ubuntu 存储库的 R 3.4.4:

> "µV"
[1] "\302\265V"

同一台计算机，R 3.4.4(以及 3.2.0 和 3.5.1)从 CRAN 获得的源代码编译:

> "µV"
[1] "µV"

我更喜欢第二种行为。差异从何而来？

Encoding("µV") 在第一种情况下返回 "unknown"，在第二种情况下返回 "UTF-8"，但是手动设置字符串变量的编码似乎并不能改善其表示。

最佳答案

出于某种原因，Sys.getencoding() 在这两个构建中有所不同。在第一个构建上运行 Sys.setlocale("LC_COLLATE", "en_US.UTF-8") 似乎解决了这个问题。

关于当使用 apt 安装/从源代码编译时，R 会以不同方式处理某些字符，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53502773/