java - 将 DOCX 转换为 XML 文件

标签 java xml docx

我需要使用docx和xml文件进行翻译过程,并不是所有的翻译工具都可以读取xml,但是docx,这就是为什么我,xml,因为它可以更好地相互分配,我想将纯文本从docx转换为xml并向后转换(从xml到docx),我可以从什么开始,你知道是否有一种方法可以使用java以编程方式完成它? dom4j可以吗?

最佳答案

您可以查看docx4j该网站说:

docx4j is a Java library for creating and manipulating Microsoft Open XML (Word docx, Powerpoint pptx, and Excel xlsx) files.

或者,Apache POI 。该网站说:

The Apache POI Project's mission is to create and maintain Java APIs for manipulating various file formats based upon the Office Open XML standards (OOXML) and Microsoft's OLE 2 Compound Document format (OLE2). In short, you can read and write MS Excel files using Java.

两者之一就足够了。由于您只关心 docx,所以选择第一个。如果有多种格式,请选择第二种。

关于java - 将 DOCX 转换为 XML 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20364845/

相关文章:

java - 使用无垃圾 Log4j 在 Web 应用程序中进行参数化日志记录

java - 将 HTML 标签解析为 XML

markdown - Pandoc Markdown 到 Docx,封面页和目录位于单独的页面中

c# - Novacode Docx 从位图创建图像

java - 在网站上跟踪用户 "current object"的最佳实践

java - Android:相机预览看起来不太好

python - 如何根据 ids 搜索(向导)填充 many2many 字段

python - 在 Windows 中使用 antiword 读取 Python 中的 .doc 文件(也是 .docx)

java - 在 Java 中构建搜索树

c# - 解析 XML 时阻止 DTD 下载