java - JSOUP文档结构问题HTML

标签 java html html-parsing jsoup

            String url = request.getParameter("url");
            Document doc = Jsoup.connect(url).get();
            Elements web = doc.childern.select("*");
            for(Element ele : web)
            {
                if(ele.hasText())
                ele.text("hello");

            }

当我打印文档时,其结构如下 你好 你好 你好

而不是

                       <html>
                        <head>
                         <title>
                         hello
                         </title>
                         <body>
                             hello
                           </body>
                          </html>

最佳答案

但是问题出在哪里呢?

如果您想在编辑中排除 head 标签,您可以使用以下命令:

Elements web = doc.body().select("*");

这只会为您提供现在可以更改的正文元素。

关于java - JSOUP文档结构问题HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14672114/

相关文章:

Java:交换对象

css - 为什么背景会覆盖我的圆 Angular ?

C# HTMLAgilityPack HTML to Text - 解析错误

java - 使用 Java 将多边形拉伸(stretch)到其他多边形

java - JLabel 尝试拖动时消失

html - itextsharp "razor to html"工作正常但 "to pdf"忽略样式

python - 如何获取 BeautifulSoup 中所有父标签的列表?

c# - 我如何在 iTextSharp 字符串中使用 HTML 标签

java - 在参数之前和之后分配实例变量有什么区别?

html - 左侧 div 中的视频内容在 Chrome 中无法正常运行