java - 如何解析 HTML 字符串以按父 div 拆分?

标签 java html

所以我有一个如下所示的 html 字符串:

<div class="row xyz"> 

    <!--Multiple Other div's and tags-->

</div>

<div class="row xws"> 

    <!--Multiple Other div's and tags-->

</div>

<div class="row daze"> 

    <!--Multiple Other div's and tags-->

</div>

如您所见,它有 3 个父 div !

我如何将我的 HTML 字符串与 JAVA 拆分为父 div 的数量,而不使用动态生成的类名“row xyz”,在本例中为 3 所以我会得到:

字符串 div1

字符串 div2

字符串 div3

其中 div1 =

<div class="row xyz"> 

    <!--Multiple Other div's and tags-->

</div>

div2 =

<div class="row xws"> 

    <!--Multiple Other div's and tags-->

</div>

div3 =

<div class="row daze"> 

    <!--Multiple Other div's and tags-->

</div>

最佳答案

尝试使用 jsoup像下面这样:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class MyClass {
    public static void main(String args[]) {
        String html = "<html><head/><body>"+
        "<div class=\"row xyz\"> <div>div1</div> <div>div1_1</div> </div>"+
        "<div class=\"row xws\"> <div>div2</div> </div>" + 
        "<div class=\"row daze\">  <div>div3</div></div>"+
        "</body></html>";
        Document document = Jsoup.parse(html);
        Elements divs = document.select("body > div");//get first level of divs

        for (int i=0; i< divs.size(); i++) {
            System.out.println(String.format("div%d = %s", i + 1, divs.get(i).outerHtml()));
        }
    }
}

输出将是:

    div1 = <div class="row xyz"> 
 <div>
  div1
 </div> 
 <div>
  div1_1
 </div> 
</div>
div2 = <div class="row xws"> 
 <div>
  div2
 </div> 
</div>
div3 = <div class="row daze"> 
 <div>
  div3
 </div>
</div>

关于java - 如何解析 HTML 字符串以按父 div 拆分?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51059137/

相关文章:

java - 当alpha已满时,ARGB和ARGB_PRE是否相同?

javascript - Input type=[number] 在显示时将 float 转换为 int

javascript - jQuery 日期选择器,自定义填充所选日期

java - 使用 Intellij 想法在 Java 11 上构建 Scala 错误

java - 向 Heroku 启动 Dropwizard 项目失败

java - 如何在一个文件夹中的多个文件中附加日期和时间,同时将其移动到另一个文件夹

html - 导航栏下拉菜单在内容下重叠

html - FIREFOX 上选择框的垂直滚动条

css - pinterest 类布局 : box get broke down

java - 从字符串中删除特定标记