css - 到达 css 节点时遇到问题

标签 css r rvest

从这个页面: http://www.beta.inegi.org.mx/app/buscador/default.html?q=e15a61a

我正在尝试检索此网址: http://www.beta.inegi.org.mx/app/biblioteca/ficha.html?upc=702825720599 ,

我试图通过 css 选择器和 xpath 访问它(通过在 Web 开发人员选项卡中右键单击进行复制),但是,我只得到一个 {xml_nodeset (0)]

library(rvest)
url <- "http://www.beta.inegi.org.mx/app/buscador/default.html?q=e15a62b"
url %>% html_node("#snippet_row-tag_a_0") 
url %>% html_node(xpath='//*[@id="snippet_row-tag_a_0"]')

最佳答案

您要抓取的元素是用 JavaScript 呈现的,您可以改用隐藏的 API:

试试这个网址:
http://www.beta.inegi.org.mx/app/api/buscador/busquedaTodos/E15A61A_A/RANKING/es

这将返回一个 JSON 字符串,您可以将其解析为 R 中的列表并提取所需的信息。

关于css - 到达 css 节点时遇到问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50997094/

相关文章:

html - 使用 Overflow :Scroll through parent with overflow:hidden 限制 div 高度

xml - rvest 不提取自关闭 xml 节点

r - 刮掉标题下的所有子段落(最好是 rvest)

javascript - 如何删除 dojo dijit 布局选项卡上的选择突出显示 css

html - 如何删除链接元素的下划线文本装饰?

html - 在 OSX Chrome 上打印 HTML 页面对齐

R dplyr pivot wider with duplicates 并生成变量名

r - 如何识别一组有序列中的第一个零?

r - 在 R 中使用 randomForest 包进行预测

r - 使用“rvest”提取链接