r - 将特殊字符转换为纯文本

标签 r

我有一个带有特殊字符的文本文件。
我想替换 enter image description here 的所有实例由 enter image description here
这就是我阅读文件的方式

donnees <- read.table("Shanghaifr.txt", sep="\t", header = TRUE)



我明白了
sample of my table

我试过了,但没有用

    donnees <- read.table("Shanghaifr.txt", sep="\t", header = TRUE)
    datest <- donnees$datesr[[15]]
    sub("ao<U+00FB>","ao\\U00FBt",datest)


例如,我应该得到 17août2017 以便我以后可以轻松完成

as.Date("17août2017", "%d%b%Y")# to get the numeric date.

最佳答案

使用 sub这里似乎有点棘手,因为它可能会进行编码。例如。:

sub("ao<U+00FB>t", "ao\u00FBt", "21ao<U+00FB>t2017", fixed = TRUE)
# [1] "21août2017"

可能的解决方法可能是(必须有更优雅的方式?!):
sub("<U\\+00FB>", enc2native("\u00FB"), "21ao<U+00FB>t2017")
# [1] "21août2017"

关于r - 将特殊字符转换为纯文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48459641/

相关文章:

r - R中的打洞卡图

r - 循环更快计算的替代方法

r - 在 RStudio 中调试 'testthat' 测试

r - 需要有关 R 中 MCMC 估计的建议

r - 错误: missing values and NaN's not allowed if 'na.rm' is FALSE

r - 帮助奇数plyr/doSMP警告

python - 仅保留后续行满足条件后的行

r - 创建热图时出错 - 外部函数调用中的 NA/NaN/Inf (arg 11)

r - 如何找到满足设定条件的数据框的尾行?

r - 在 R 中写入一个非常大的稀疏矩阵到文件