我有一个项目需要创建一个具有特定格式和从我的数据库中获取的特定数据的 Word (.doc) 文件。我想将该文件输出给用户,他将编辑该文件并将文件上传回服务器。之后我想对上传的文件进行如下转换。
- .doc 到 .pdf(旨在下载并在网络上查看)
- .doc 到 .html(用于网络上的自由文本搜索)
我想在不打开 Open Office 端口的情况下实现这一点。较早的版本是这样做的,但是当用户较多时,打开的端口有崩溃的趋势。所以我想避免这样做。 Open Office 和 OS 都在其他机器上重新安装并尝试了不同的方法,但每次用户增加时 OO 端口都会崩溃。
还有其他方法可以实现这种转换吗?由于崩溃,无法继续执行此操作。
这是主机:
- Linux 上的 Tomcat 服务器(RedHat 64 位)
- 应用程序是用 Java 开发的(JSP 和 Servlets)
- 后端是甲骨文
所有用户都有:
- Linux 机器,主要是 32 位 Fedora 或 Suse
感谢任何帮助。
最佳答案
你可以使用 http://poi.apache.org/用于处理实际的 .doc 文件。对于 PDF,也有许多可用的 PDF 库。问题是很多都不是免费的,但这里有一个开源 PDF 库列表:http://java-source.net/open-source/pdf-libraries
这里是关于 Word 到 HTML 的讨论。 Convert Word doc to HTML programmatically in Java
关于java - 创建一个 Word (.doc) 文件,将其转换为 PDF 和 HTML,无需打开 Open Office 端口,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4968904/