来自 Ubuntu 存储库的 R 3.4.4:
> "µV"
[1] "\302\265V"
同一台计算机,R 3.4.4(以及 3.2.0 和 3.5.1)从 CRAN 获得的源代码编译:
> "µV"
[1] "µV"
我更喜欢第二种行为。差异从何而来?
Encoding("µV")
在第一种情况下返回 "unknown"
,在第二种情况下返回 "UTF-8"
,但是手动设置字符串变量的编码似乎并不能改善其表示。
最佳答案
出于某种原因,Sys.getencoding()
在这两个构建中有所不同。在第一个构建上运行 Sys.setlocale("LC_COLLATE", "en_US.UTF-8")
似乎解决了这个问题。
关于当使用 apt 安装/从源代码编译时,R 会以不同方式处理某些字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53502773/