R 中有没有一种方法可以转换 HTML 字符实体编码?
我想将 HTML 字符实体转换为
&
到 &
或者
>
到 >
对于 Perl,存在可以做到这一点的包 HTML::Entities,但我在 R 中找不到类似的东西。
我也试过 iconv()
但没有得到满意的结果。也许还有一种使用 XML
包的方法,但我还没有弄清楚。
最佳答案
使用 xml2
包转义 xml/html 值:
unescape_xml <- function(str){
xml2::xml_text(xml2::read_xml(paste0("<x>", str, "</x>")))
}
unescape_html <- function(str){
xml2::xml_text(xml2::read_html(paste0("<x>", str, "</x>")))
}
例子:
unescape_xml("3 < x & x > 9")
# [1] "3 < x & x > 9"
unescape_html("€ 2.99")
# [1] "€ 2.99"
关于html - 在 R 中转换 HTML 字符实体编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5060076/