当使用 apt 安装/从源代码编译时,R 会以不同方式处理某些字符

标签 r ubuntu non-ascii-characters

来自 Ubuntu 存储库的 R 3.4.4:

> "µV"
[1] "\302\265V"

同一台计算机,R 3.4.4(以及 3.2.0 和 3.5.1)从 CRAN 获得的源代码编译:

> "µV"
[1] "µV"

我更喜欢第二种行为。差异从何而来?

Encoding("µV") 在第一种情况下返回 "unknown",在第二种情况下返回 "UTF-8",但是手动设置字符串变量的编码似乎并不能改善其表示。

最佳答案

出于某种原因,Sys.getencoding() 在这两个构建中有所不同。在第一个构建上运行 Sys.setlocale("LC_COLLATE", "en_US.UTF-8") 似乎解决了这个问题。

关于当使用 apt 安装/从源代码编译时,R 会以不同方式处理某些字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53502773/

相关文章:

r - 从 RColorBrewer 调色板中选择单个颜色作为 ggplot2 中的 scale_colour_manual() 值

java - Ubuntu 伴侣 : Android Studio - Gradle project sync failed

git - Docker 无法在 Ubuntu 容器上安装 git

c# - 将编码的俄语字符从 url 解码为 BHO 中的实际字符

python - 报告实验室无法处理希伯来语 (unicode)

使用函数式编程用 dplyr 重命名列

R:在使用north2()创建带有指北针的 map 后使用ggsave保存图形

r - 如何使用模型名称和变量列表来计算表及其预测?

android - 未正确检测到 Kubuntu 9.10 Android 设备

python - 如何检查第一个字符是 ñ - Django