r - 如何获取特殊字符的原始数字 HTML 表示形式?

标签 r regex encoding special-characters

当我在 R 中输入 "\xfc" 时,它会显示 [1] "ü"。我不希望这样,我希望这会导致 [1] "\xfc"。我也不太明白为什么 Encoding("\xfc")"latin1" 尽管我将代码->保存中的设置更改为 UTF-8。我想编写一个函数,用 "\xfc" 替换一些特殊字符,例如 "ü" 但我无法实现此目的:

> stringr::str_replace_all("Müller", "ü", "\xfc")
[1] "Müller"
> stringr::str_replace_all("Müller", "ü", "\\xfc")
[1] "Mxfcller"
> stringr::str_replace_all("Müller", "ü", "\\\xfc")
[1] "Müller"
> stringr::str_replace_all("Müller", "ü", "\\\\xfc")
[1] "M\\xfcller"

我真正想要的是[1]“M\xfcller”

(如何)我可以实现这一目标?

最佳答案

最后一行给出了您想要的结果。打印字符串时,反斜杠会被转义。为了看到这一点,我们将字符串保存到文件中,然后查看文件的内容。


s <- stringr::str_replace_all("Müller", "ü", "\\\\xfc")

writeLines(s, "test.txt")

cat(readLines("test.txt"))
#> M\xfcller

reprex package 创建于 2019-03-27 (v0.2.1)

另请参阅此 GitHub 问题:https://github.com/STAT545-UBC/Discussion/issues/394

关于r - 如何获取特殊字符的原始数字 HTML 表示形式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55372670/

相关文章:

r - ggplot2,直方图 : why do y = . .密度 .. 和 stat = "density"有什么不同?

r - 了解 ' | ' 和 ' & ' 运算符行为(R 的逻辑运算符)

r - 重新分类栅格包中的 include.lowest 是什么意思 [r]

Javascript RegEx 没有按预期返回 false

javascript - 使用 jquery 文本框仅允许带点的十进制数字

php - preg_split 不删除搜索模式

c# - 如何在 .NET 中为正则表达式编码字符串?

python - 将 ☺ 编码为 IBM-437 失败,而 é 等其他有效字符成功

r - ggplot 散点图和线条

encoding - 为什么两个文本和编码相同但大小不同的文件?