java - 如何删除字符串中的 HTML 元素?

标签 java javascript html

我想删除Java中字符串的HTML。

<hr><b><strong>Task Details</strong></b><hr><b>Date Created: </b> 01/06/2014 07:55pm<br><b>Date Modified: </b> 01/06/2014 07:55pm<br><b>Assigned to: </b> Administrator<br><b>Created By: </b> Administrator<br><b>Status: </b> Not Started<br><b>Description: </b> Test Description<br>.

上面是我的字符串,我想删除 HTML 标签。

最佳答案

也许这会起作用:

String noHTMLString = htmlString.replaceAll("\\<.*?>","");

它使用正则表达式删除字符串中的所有 HTML 标记。

更具体地说,它从字符串中删除所有类似 XML 的标签。因此,即使 <1234> 不是有效的 HTML 标记,它也会被删除。但它对大多数意图和目的都有好处。

希望这有帮助。

这实际上非常简单 Jsoup.

public static String html2text(String html) {
    return Jsoup.parse(html).text();
}

关于java - 如何删除字符串中的 HTML 元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21013550/

相关文章:

java - 真正的 Java 泛型(模板)

Java 正则表达式将 HTML 标签包裹在文本周围

java - 随机选择2个定义的数字

javascript - 在 Javascript 中测试正则表达式 OnBlur?

具有许多嵌套和 float Div 的 CSS 100% 高度

jquery - 如何使子div = 父级的高度显示:inline-block and unspecified height?

java - 如何使用子字符串方法返回奇数字符串的中间 3 个字符?

javascript - 不仅可以看到场景 BG 的折射效果,还可以看到 3D 模型的折射效果

javascript - jQuery添加的反斜杠怎么去掉

javascript - 如果没有找到数据,则将选择值更改为 null