我需要使用docx和xml文件进行翻译过程,并不是所有的翻译工具都可以读取xml,但是docx,这就是为什么我,xml,因为它可以更好地相互分配,我想将纯文本从docx转换为xml并向后转换(从xml到docx),我可以从什么开始,你知道是否有一种方法可以使用java以编程方式完成它? dom4j可以吗?
最佳答案
您可以查看docx4j该网站说:
docx4j is a Java library for creating and manipulating Microsoft Open XML (Word docx, Powerpoint pptx, and Excel xlsx) files.
或者,Apache POI 。该网站说:
The Apache POI Project's mission is to create and maintain Java APIs for manipulating various file formats based upon the Office Open XML standards (OOXML) and Microsoft's OLE 2 Compound Document format (OLE2). In short, you can read and write MS Excel files using Java.
两者之一就足够了。由于您只关心 docx
,所以选择第一个。如果有多种格式,请选择第二种。
关于java - 将 DOCX 转换为 XML 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20364845/