java - 使用 Java 将 RTF 转换为 XML

标签 java xml etl rtf data-transform

我有一个富文本文档(.rtf 或 .doc),其中包含大量数据元素,需要读取这些数据元素并将其转换为 XML 或 Json 结构化数据对象。这些文档在数据方面具有一定的格式。是否有任何我可以使用 java.util.convert 进行转换的库?有人遇到过这种情况吗?

有人尝试过 Apache POI 或 Apache Tika 转换为 XML

最佳答案

我会将这个任务分解为两个解析器和两个序列化器

  1. 将 rtf 解析为 java 模型
  2. 将 doc 解析为 java 模型
  3. 将 java 模型序列化为 xml
  4. 将java模型序列化为json

对于 1 和 2,使用 POI 是相当标准的。 。 对于 3 和 4,您有更多选择,一个流行的选项是 Jackson

关于java - 使用 Java 将 RTF 转换为 XML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60329843/

相关文章:

java - 如何让 Java maven 构建因编译器警告而失败?

java - 使用 Java 在循环中获取输入

xml - xsd :include and xsd:import?有什么区别

sql - SSIS 包在调试时立即取消

python - Airflow :运行一次 Airflow 子标记的模式

java - 位图而不是 View 上的波纹动画

java - 检查 url 当前是否位于正确的位置以及格式正确的 id

xml - 如何编写 xpath 以匹配除特定元素之外的所有元素

c# - 您如何测试抛出异常的具体原因?

sql-server - 将程序集添加到缓存 : This assembly is built by a runtime newer than the currently loaded runtime and cannot be loaded 失败