r - 使用 rvest 捕获 onclick

标签 r rvest

我一直在努力使用 rvest 获取一段数据。我正在寻找的数据是值 20960,它是 insideOpenView(20960)。我将如何通过 rvest 实现这一目标?

我正在使用的 html 的一个示例部分是

<tr class="row-1" align="left">
<td style="width:120px;">
<a href="#" onclick='OpenView(20960 );return false;'>
BAKER, JAIME EDWARD</a>
</td>
</tr>

最佳答案

我认为这需要一些grepping...

library("rvest")
library("stringr")
read_html('<tr class="row-1" align="left">
<td style="width:120px;">
          <a href="#" onclick=\'OpenView(20960 );return false;\'>
          BAKER, JAIME EDWARD</a>
            </td>
            </tr>') %>% 
  html_nodes("a") %>% 
  html_attr("onclick") %>%
  str_extract("(?<=\\().*(?=\\))") %>%    # returns the stuff inside the parens
  str_trim(side="both")                   # trims whitespace from both sides
  [1] "20960"

关于r - 使用 rvest 捕获 onclick,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35908454/

相关文章:

r - 如何将变量名称绑定(bind)到 df

如果出错,重试 for-loop R 循环

r - 邮件R : how to send rmarkdown documents as body in email?

read_html -- read_connection_(x, n) : Evaluation error: Failure when receiving data from the peer 中的错误

ajax - 使用 R 抓取具有 Ajax 表的网站

r - 获取属于一个因子的所有系数

使用 xpath 在 R 中使用 xml2 读取 sbml 文件

r - 禁用对话框 - 另存为 - Rselenium

r - 使用R搜寻网站以获得政府信息

r - 将字符串拆分为单词并分配给新列