使用 UTF-8 编码的 read.csv()

标签 r utf-8 read.csv

这个问题在这里已经有了答案:





Cannot read unicode .csv into R

(3 个回答)


4年前关闭。




我正在尝试从 csv 文件中读取数据并将字符的编码指定为 UTF-8。通过阅读 ?read.csv() 指令,似乎 fileEncoding 设置等于 UTF-8 应该完成这一点,但是,我在检查时没有看到。导入数据时是否有更好的方法将字符串的编码指定为UTF-8?

样本数据:

Download Sample Data here

fruit<- read.csv("fruit.csv", header = TRUE, fileEncoding = "UTF-8")
fruit[] <- lapply(fruit, as.character)
Encoding(fruit$Fruit)

输出是“未知”,但我希望这是“UTF-8”。确保所有导入的字符都是 UTF-8 的最佳方法是什么?谢谢你。

最佳答案

fruit       <- read.csv("fruit.csv", header = TRUE)
fruit[]     <- lapply(fruit, as.character)
fruit$Fruit <- paste0(fruit$Fruit, "\xfcmlaut") # Get non-ASCII char and jam it in!
Encoding(fruit$Fruit)

[1] "latin1" "latin1" "latin1"


fruit$Fruit <- enc2utf8(fruit$Fruit)
Encoding(fruit$Fruit)

[1] "UTF-8" "UTF-8" "UTF-8"

关于使用 UTF-8 编码的 read.csv(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38986909/

相关文章:

r - 使用 R 检查值是否在区间内

r - 在每个组之前插入行

r - 导出时,如何用单个空格替换read.csv()生成的列名中的 “.”?

r - 如何读取以下格式的文件

javascript - 如何将总计添加到 DT::datatable?

r - 以固定的时间间隔更新图形/绘图

utf-8 - 这些角色是什么鬼?

mysql - 在 Ruby 1.8.7 中插入 MySQL 数据库时,Unicode 格式丢失

PHP:使用 UTF-8 的 json_encode 和 json_decode

将多行文本 block 读入 R 中的单个向量