java - 使用 JSOUP 进行作者解析

标签 java html parsing html-parsing

这是我的 html 输入:

  <!-- left panel --> 
  <div class="left-panel"> 
    <p class="article-published"> 1. júl 2015 o 17:35 &nbsp;&nbsp; Marek Hudec, Dávid Tvrdoň </p>
  </div>

和代码:

if(doc.select("p[class=article-published]").isEmpty() == FALSE){
    Elements description = doc.select("p[class=article-published]");
    for (Element link : description) {
        author4 = link.text();
    }
    System.out.println("AUTHORS :" + author4);
 }

我想获得输出,例如:Marek Hudec、Dávid Tvrdoň。所以只有那些人的名字。但我还无法得到它。请有人帮助我。谢谢

最佳答案

您所要做的就是解析从 Jsoup 获得的文本并从中截取您想要的数据,在下面的代码中,我修改了您的代码以从特定索引获取数据。

 import java.util.Arrays;
 import org.jsoup.Jsoup;
 import org.jsoup.nodes.Document;
 import org.jsoup.nodes.Element;
 import org.jsoup.select.Elements;

 public class KolosParsor {   
        public static void main(String[] args) {
            String author4 = null;
            Document doc = Jsoup.parse("<div class=\"left-panel\">"+ 
             "<p class=\"article-published\"> 1. júl 2015 o 17:35 &nbsp;&nbsp; Marek Hudec,Dávid Tvrdoň </p>");
            if(!doc.select("p[class=article-published]").isEmpty()){
                Elements description = doc.select("p[class=article-published]");
                for (Element link : description) {
                     author4 = link.text();
                 }
                 System.out.println("DATA :" + Arrays.asList(author4.split(" ")));
                 System.out.println("AUTHORS :" + Arrays.asList(author4.split(" ")).get(7));
             }          
        }
    }

关于java - 使用 JSOUP 进行作者解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33398215/

相关文章:

java - 实例化工具包时遇到问题?

javascript - 为不同级别/用户权限设计网页的更好方法是什么?

javascript - 可以在页面处理之前修改传入数据的 Firefox 插件?

javascript - 使用 jquery 自动输入表单

android - 使用 Xpath 在 Android 中解析 XMl

python - 在 Python 中动态读取更新的文件

java - 如何在 Java NetBeans 中显示 CJK 字符和 GUI?

java - 运行 mvn install 会导致 OOM 错误

java - 尝试将 Java Spring 应用程序连接到远程 MongoDB 时,打开套接字时出现异常,连接被拒绝

php - php 中的前缀到中缀