xml - htmlParse 无法加载外部实体

标签 xml r

我正在尝试使用 R 和 XML 包加载一些公开可用的 NHS 数据,但我不断收到以下错误消息:

Error: failed to load external entity "http://www.england.nhs.uk/statistics/statistical-work-areas/bed-availability-and-occupancy/"

尽管查看了一些相关问题,但我似乎无法弄清楚是什么原因造成的。

这是我非常简单的代码:

library("XML")
url <- "http://www.england.nhs.uk/statistics/statistical-work-areas/bed-availability-and-occupancy/"
doc <- htmlParse(url)

编辑: session 信息

R version 3.0.1 (2013-05-16) Platform: i386-w64-mingw32/i386 (32-bit)

locale: [1] LC_COLLATE=English_United Kingdom.1252 LC_CTYPE=English_United Kingdom.1252 [3] LC_MONETARY=English_United Kingdom.1252 LC_NUMERIC=C [5] LC_TIME=English_United Kingdom.1252

attached base packages: [1] stats graphics grDevices utils
datasets methods base

loaded via a namespace (and not attached): [1] tools_3.0.1

最佳答案

包 XML 有一些问题。该问题是间歇性的,与 URL 无关。我使用 httr 包的 GET 函数解决了这个问题,以获取 html 代码,然后将其传递给 htmlParse,如下所示:

library("XML")
library(httr)
url <- "http://www.england.nhs.uk/statistics/statistical-work-areas/bed-availability-and-occupancy/"
doc <- htmlParse(rawToChar(GET(url)$content))

关于xml - htmlParse 无法加载外部实体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23430547/

相关文章:

r - 在 ggplot2 中创建散点图矩阵(pairs() 等效项)

java - Rserve 连接失败

用多个替换替换多个模式

r - 修改 ggplot 中的 viridis 调色板

PHP解析xml xpath

xml - 从 XML 中提取范式

php - 使用 Xpath 查找具有特定子元素的 XML 节点

regex - R:反斜线(\)

java - 制作无限可滚动的 ImageView

php - 无法使用 JMS 序列化程序将空数组序列化为空 XML 元素