r - 数据抓取;使用 rvest 从表中提取链接

标签 r web-scraping web-crawler rvest

我正在尝试从此表中提取所有播放器链接:

https://www.footballdb.com/players/players.html?letter=A

这是我的代码:

library(rvest)

url <- "https://www.footballdb.com/players/players.html?letter=A"
webpage <- read_html(url)

webpage %>%
  html_nodes("table") %>%
  html_attr("href")

这将返回 NA。我看过其他有类似问题的帖子,但我未能很好地理解答案,无法将它们应用到这个问题上。任何解决方案和/或指导将不胜感激。谢谢。

最佳答案

我认为你必须更深入一点;)

webpage %>%
  html_nodes("table") %>%
  html_nodes("td") %>% 
  html_nodes("a") %>% 
  html_attr("href")

关于r - 数据抓取;使用 rvest 从表中提取链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50513585/

相关文章:

javascript - 卡斯珀JS : Selecting an option in dropdown menu made of <div> and dynamic classes

python - 如何使用选择器选择html元素的属性?

javascript - 我可以使用 Node.js 包(例如 request)来抓取这个西澳政府网站上的 AngularJS 响应吗?

使用更改 href 进行 Python 网络抓取

selenium - 如何使用 Python 填写 JavaScript 表单?

python - 列出 import.io 中的提取器

r - 在 r 中的向量边界处填充 NA

r - 使用 purrr::map 在数据框中的列上迭代线性模型

r - 将数据框中的列移至 R 中其他列的下方

r - 检查具有不同功能的数据框(dplyr)