r - 将阿拉伯文本分配给 R 变量

标签 r unicode encoding locale iconv

R 无法正确显示阿拉伯文本。当我使用阿拉伯语时,我得到了非常奇怪的东西。这是屏幕截图:

enter image description here

问题是我想创建一个包含阿拉伯文本的词云,我需要首先解决这个问题。

R 版本:R 2.15.2 GUI 1.53 Leopard 版本 64 位 (6335)

以下是更多信息:

> options("encoding")
$encoding
[1] "native.enc"

> Encoding("الله")
[1] "unknown"

session 信息():

> sessionInfo()
R version 2.15.2 (2012-10-26)
Platform: x86_64-apple-darwin9.8.0/x86_64 (64-bit)

locale:
[1] C/C/C/C/de_DE/C

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

loaded via a namespace (and not attached):
[1] tools_2.15.2
> 

一些修补:

> x = "مرحبا"
> Encoding(x) = "UTF-8"
> x
[1] "<U+0645><U+0631><U+062D><U+0628><U+0627>"
> Encoding(iconv(x))
[1] "unknown"

更多信息:

> Sys.getlocale()
[1] "C/C/C/C/de_DE/C"
> Sys.setlocale("LC_ALL", "en_US.utf8")
[1] ""
Warning message:
In Sys.setlocale("LC_ALL", "en_US.utf8") :
  OS reports request to set locale to "en_US.utf8" cannot be honored
> 

这解决了问题:

Sys.setlocale("LC_ALL", "en_US.UTF-8")

最佳答案

这有效:

Sys.setlocale("LC_ALL", "en_US.UTF-8")

关于r - 将阿拉伯文本分配给 R 变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18677571/

相关文章:

android - 错误的高棉语 Unicode 字符串

java - 使用 apache FIleutilities 读取 sql 文件时使用的编码

ruby-on-rails - 如何全局忽略 UTF-8 字符串中的无效字节序列?

r - 如何将 Material 切换与shinydashboard一起使用[R]

r - 如何使用 sf 的 st_distance 函数在检查数据时给出错误来解决这个问题?

python - 读取 Unicode 文件 - Python3.2

python - 无法使用 cx-Oracle 插入 Unicode

Python:关于编码的问题

r - dplyr + magrittr + qplot = 没有情节?

r - R 中函数的优化(L-BFGS-B 需要 'fn' 的有限值)