这个问题在这里已经有了答案:
Cannot read unicode .csv into R
(3 个回答)
4年前关闭。
我正在尝试从 csv 文件中读取数据并将字符的编码指定为 UTF-8。通过阅读 ?read.csv() 指令,似乎 fileEncoding 设置等于 UTF-8 应该完成这一点,但是,我在检查时没有看到。导入数据时是否有更好的方法将字符串的编码指定为UTF-8?
样本数据:
Download Sample Data here
fruit<- read.csv("fruit.csv", header = TRUE, fileEncoding = "UTF-8")
fruit[] <- lapply(fruit, as.character)
Encoding(fruit$Fruit)
输出是“未知”,但我希望这是“UTF-8”。确保所有导入的字符都是 UTF-8 的最佳方法是什么?谢谢你。
最佳答案
fruit <- read.csv("fruit.csv", header = TRUE)
fruit[] <- lapply(fruit, as.character)
fruit$Fruit <- paste0(fruit$Fruit, "\xfcmlaut") # Get non-ASCII char and jam it in!
Encoding(fruit$Fruit)
[1] "latin1" "latin1" "latin1"
fruit$Fruit <- enc2utf8(fruit$Fruit)
Encoding(fruit$Fruit)
[1] "UTF-8" "UTF-8" "UTF-8"
关于使用 UTF-8 编码的 read.csv(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38986909/