java - 使用 JSoup 在 Java 中修改 html 标签自己的文本

标签 java html jsoup

所以是的,假设我有这段 HTML

<p>And finally, how about some <a href="http://www.yahoo.com/">Links?</a></p>

我只想访问和修改“最后,一些怎么样”部分,并得到这个:

<p>new text <a href="http://www.yahoo.com/">Links?</a></p>

我似乎不知道该怎么做。这是我到目前为止所尝试过的:

Document doc = null;
    try {
        doc = Jsoup.connect("http://csb.stanford.edu/class/public/pages/sykes_webdesign/05_simple.html").userAgent("Mozilla").get();
    } catch (IOException e1) {
        e1.printStackTrace();
    }
Elements d = doc.body().children();
Element e = d.get(20); //Assuming the HTML line in question is found at index 20
e.text("new text") //just outputs <p>new value</p>, which is not good for me

看来我可以通过以下方式访问它

Element e = d.get(20);
System.out.println("\n"+e.ownText()); //outputs: And finally, how about some

但是修改它不起作用。

Element e = d.get(20);
String s = e.toString().replace(e.ownText(), "new text");
e.text(s);
System.out.println(e.toString());

上面代码的输出是

<p>&lt;p&gt;changed &lt;a href=&quot;http://www.yahoo.com/&quot;&gt;Links?&lt;/a&gt;&lt;/p&gt;</p>

它似乎将标签视为文字,但我希望它们为 < 或 >,因为然后我必须使用新文本重新构建网页。

我们将非常感谢任何形式的帮助。

最佳答案

像这样的东西怎么样

Element e = d.get(20);
e.text("new text"); 
e.append("<a href=\"http://www.yahoo.com/\">Links?</a>");//lets you add HTML.

如果链接是动态的并且您不想更改它,您可以提前存储它并稍后使用

Element e = d.get(20);
Element link = e.child(0);
e.text("new text"); 
e.append(link.toString());

关于java - 使用 JSoup 在 Java 中修改 html 标签自己的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22205683/

相关文章:

java - 如何更改全息主题中的水平蓝色进度条

javascript - 将数组表中的数据输入到列表中

html - 表格 (X)HTML 表单

java - 如何让 jsoup 等待完整页面(跳过进度页面)加载?

java - token "String"语法错误,删除此 token

java - 除了 SimpleDateFormat 之外,如何在时间设置上添加一个小时?

java - 如何在xml中进行这样的布局?安卓

javascript - 希望用选定的缩略图切换主图像

java - 使用 Jsoup.Jar 进行 HTML 解析

java - org.jsoup.select.Selector$SelectorParseException : Could not parse query '' : unexpected token at ''