css - 到达 css 节点时遇到问题

从这个页面: http://www.beta.inegi.org.mx/app/buscador/default.html?q=e15a61a

我正在尝试检索此网址: http://www.beta.inegi.org.mx/app/biblioteca/ficha.html?upc=702825720599 ,

我试图通过 css 选择器和 xpath 访问它(通过在 Web 开发人员选项卡中右键单击进行复制)，但是，我只得到一个 {xml_nodeset (0)]

library(rvest)
url <- "http://www.beta.inegi.org.mx/app/buscador/default.html?q=e15a62b"
url %>% html_node("#snippet_row-tag_a_0") 
url %>% html_node(xpath='//*[@id="snippet_row-tag_a_0"]')

最佳答案

您要抓取的元素是用 JavaScript 呈现的，您可以改用隐藏的 API:

试试这个网址:
http://www.beta.inegi.org.mx/app/api/buscador/busquedaTodos/E15A61A_A/RANKING/es

这将返回一个 JSON 字符串，您可以将其解析为 R 中的列表并提取所需的信息。

关于css - 到达 css 节点时遇到问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50997094/

上一篇：html - 如何设置子div元素从其位置到页面底部的高度？

下一篇：html - 防止菜单项在焦点上移动

xml - rvest 不提取自关闭 xml 节点

r - 刮掉标题下的所有子段落(最好是 rvest)

javascript - 如何删除 dojo dijit 布局选项卡上的选择突出显示 css

html - 如何删除链接元素的下划线文本装饰？

html - 在 OSX Chrome 上打印 HTML 页面对齐

R dplyr pivot wider with duplicates 并生成变量名

r - 如何识别一组有序列中的第一个零？

r - 在 R 中使用 randomForest 包进行预测

r - 使用“rvest”提取链接