我有一个富文本文档(.rtf 或 .doc),其中包含大量数据元素,需要读取这些数据元素并将其转换为 XML 或 Json 结构化数据对象。这些文档在数据方面具有一定的格式。是否有任何我可以使用 java.util.convert 进行转换的库?有人遇到过这种情况吗?
有人尝试过 Apache POI 或 Apache Tika 转换为 XML
最佳答案
我会将这个任务分解为两个解析器和两个序列化器
- 将 rtf 解析为 java 模型
- 将 doc 解析为 java 模型
- 将 java 模型序列化为 xml
- 将java模型序列化为json
关于java - 使用 Java 将 RTF 转换为 XML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60329843/