html - 在 R 中转换 HTML 字符实体编码

标签 html r encoding character-encoding

R 中有没有一种方法可以转换 HTML 字符实体编码?

我想将 HTML 字符实体转换为 && 或者 >>

对于 Perl,存在可以做到这一点的包 HTML::Entities,但我在 R 中找不到类似的东西。

我也试过 iconv() 但没有得到满意的结果。也许还有一种使用 XML 包的方法,但我还没有弄清楚。

最佳答案

使用 xml2 包转义 xml/html 值:

unescape_xml <- function(str){
  xml2::xml_text(xml2::read_xml(paste0("<x>", str, "</x>")))
}

unescape_html <- function(str){
  xml2::xml_text(xml2::read_html(paste0("<x>", str, "</x>")))
}

例子:

unescape_xml("3 &lt; x &amp; x &gt; 9")
# [1] "3 < x & x > 9"
unescape_html("&euro; 2.99")
# [1] "€ 2.99"

关于html - 在 R 中转换 HTML 字符实体编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5060076/

相关文章:

r - 向量中的混合类型(没有类型转换的 rbind 数据框)

python - 在 python 中从 windows-1252 转换为 utf-8

java - 更改 Eclipse 的编码字符

javascript - jQuery scrollTop - 动画不起作用

html - 无法在 HTML 中处理 Typescript 枚举

css - 将按钮和链接放在 particles.js 脚本(Z-index)上

c# - HttpWebResponse 的编码问题

javascript - 逐渐在 html 文本框中记录事件

r - 如何根据条件自连接 data.table

r - 使用ggplot2更改图例