我想删除Java中字符串的HTML。
<hr><b><strong>Task Details</strong></b><hr><b>Date Created: </b> 01/06/2014 07:55pm<br><b>Date Modified: </b> 01/06/2014 07:55pm<br><b>Assigned to: </b> Administrator<br><b>Created By: </b> Administrator<br><b>Status: </b> Not Started<br><b>Description: </b> Test Description<br>.
上面是我的字符串,我想删除 HTML 标签。
最佳答案
也许这会起作用:
String noHTMLString = htmlString.replaceAll("\\<.*?>","");
它使用正则表达式删除字符串中的所有 HTML 标记。
更具体地说,它从字符串中删除所有类似 XML 的标签。因此,即使 <1234> 不是有效的 HTML 标记,它也会被删除。但它对大多数意图和目的都有好处。
希望这有帮助。
这实际上非常简单 Jsoup.
public static String html2text(String html) {
return Jsoup.parse(html).text();
}
关于java - 如何删除字符串中的 HTML 元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21013550/