html - 如何获取选择菜单的值?

标签 html r web-scraping rvest

我正在尝试获取 this webpage 上选择菜单的值(所有区域) 。我有什么错?几乎尝试了所有组合,但结果为零。其中之一是:

  page <- read_html("https://www.yemeksepeti.com/en/istanbul")
  regions <- page %>% 
    html_nodes("div") %>% 
    html_nodes("span") %>% 
    html_nodes(xpath = '//*[@id="select2-ys-areaSelector-container"]') %>% 
    html_attr("title")

提前致谢。

最佳答案

XPath 是一种丑陋的野兽。获取select元素的id,然后获取所有选项组,最后获取它们的文本数据。使用 html_text 将其转换为 R character

page <- read_html("https://www.yemeksepeti.com/en/istanbul")
regions <- page %>% 
  html_nodes(xpath='//*[@id="ys-areaSelector"]/optgroup/*/text()') %>%
  html_text()

关于html - 如何获取选择菜单的值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56186047/

相关文章:

javascript - 使用 handlebars helper 生成新数组,并在 html 中使用新数组

html - Cals 表格样式

r - 循环遍历矩阵的对角线+1

java - 如何通过Java程序读取网页内容?

python - 无法纠正 - ValueError : unknown url type: Link

javascript - Appending Child 会在 JavaScript 上重置之前附加的元素值

html - div 中所有 h 标签下方的空白

r - 解决R中的复数方程

r - 当一个图使用 ggplot 覆盖另一个图时如何制作自定义图例?

javascript - 如何在java中使用网络爬虫获取内容