r - 如何获取特殊字符的原始数字 HTML 表示形式？

标签 r regex encoding special-characters

当我在 R 中输入 "\xfc" 时，它会显示 [1] "ü"。我不希望这样，我希望这会导致 [1] "\xfc"。我也不太明白为什么 Encoding("\xfc") 是 "latin1" 尽管我将代码->保存中的设置更改为 UTF-8。我想编写一个函数，用 "\xfc" 替换一些特殊字符，例如 "ü" 但我无法实现此目的:

> stringr::str_replace_all("Müller", "ü", "\xfc")
[1] "Müller"
> stringr::str_replace_all("Müller", "ü", "\\xfc")
[1] "Mxfcller"
> stringr::str_replace_all("Müller", "ü", "\\\xfc")
[1] "Müller"
> stringr::str_replace_all("Müller", "ü", "\\\\xfc")
[1] "M\\xfcller"

我真正想要的是[1]“M\xfcller”

(如何)我可以实现这一目标？

最佳答案

最后一行给出了您想要的结果。打印字符串时，反斜杠会被转义。为了看到这一点，我们将字符串保存到文件中，然后查看文件的内容。


s <- stringr::str_replace_all("Müller", "ü", "\\\\xfc")

writeLines(s, "test.txt")

cat(readLines("test.txt"))
#> M\xfcller

^{由 reprex package 创建于 2019-03-27 (v0.2.1)}

另请参阅此 GitHub 问题:https://github.com/STAT545-UBC/Discussion/issues/394

关于r - 如何获取特殊字符的原始数字 HTML 表示形式？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55372670/

上一篇：php - 使用 key 从 foreach 循环创建数组

下一篇：java - Mockito:试图监视方法正在调用原始方法

r - 了解 ' | ' 和 ' & ' 运算符行为(R 的逻辑运算符)

r - 重新分类栅格包中的 include.lowest 是什么意思 [r]

Javascript RegEx 没有按预期返回 false

javascript - 使用 jquery 文本框仅允许带点的十进制数字

php - preg_split 不删除搜索模式

c# - 如何在 .NET 中为正则表达式编码字符串？

python - 将 ☺ 编码为 IBM-437 失败，而 é 等其他有效字符成功

r - ggplot 散点图和线条

encoding - 为什么两个文本和编码相同但大小不同的文件？