java - 如何使用 Java 创建基本的人类可读的 XHTML 纯文本表示?

标签 java html xhtml plaintext

鉴于一些简单的 XHTML,我想创建一个人类可读的纯文本版本。这将涉及删除所有 HTML 标记,但添加或保留一些空格。

例如,这个输入:

<div>
<p>This is some text, some is <b>bold</b>.</p>
<ul>
  <li>Point one</li>
  <li>Point two</li>
</ul>
</div>

会变成:

"This is some text, some is bold. Point one Point two"

(LI 之间的逗号是理想的...:)

最佳答案

杰里科 HTML 解析器。您可以去除所有标签或调用试图模仿外观的“渲染器”类(例如,您的项目符号列表将被标记)

关于java - 如何使用 Java 创建基本的人类可读的 XHTML 纯文本表示?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5095125/

相关文章:

java - 以编程方式关闭 Java 托盘气球

java - 如何在 checkstyle 配置中添加异常

java - 如何区分元素?

html - 禁用 Bootstrap 3 单页网站的事件链接样式

html - 两步 View 模式: XSLT vs.对象图

java - -4偏移后当前时间为负

javascript - 定位绝对 div 并在 div 外部切换

jquery - 当我们点击后面时,前面应该在点击事件中打开

css - 文档转换软件: XHTML and CSS to PDF

java - 在 XHTML 中嵌入 HTML