java - 无法返回 href (jSoup) 中的文本

标签 java jsoup

这是我用来从下面的 html 片段访问“test”的代码片段。如何访问网址https://www.google.com从 html 中?

Elements e = doc.getElementsByAttribute("href");
Iterator<Element> href = e.iterator();
    while ( href.hasNext() ){
    Element link = href.next();
    String text = link.text();
    }



   <a href="javascript:linkToExternalSite('https://www.google.com','','61x38pxls','','','','','')">Test</a>

最佳答案

我不是 Jsoup 专家,但 Jsoup 是一个 html 解析器,你不能用它来解析 javascript 标记内的内容。

所以,你的方法应该是提取

"javascript:linkToExternalSite('https://www.google.com','','61x38pxls','','','','','')"

使用 Jsoup。

比使用regular expressions获取内容/url。

关于java - 无法返回 href (jSoup) 中的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9025308/

相关文章:

java - java中如何从一个方法返回两个值

java函数读取文件夹中的文件

java - 为什么我无法获取所有页面

java - 获取文本节点内 anchor 中的文本

java - 是否可以通过Crawler4j检索网站内容?

java - 抓取时缺少表格元素

java - 双代理接口(interface) : Could not generate CGLIB subclass of class 时 Spring AspectJ 失败

java - 在netbeans项目类别java文件夹中丢失

java - Maven 不会创建可运行的 jar

java - 使用 EL 使用 foreach 遍历 arraylist