java - 创建一个 Word (.doc) 文件,将其转换为 PDF 和 HTML,无需打开 Open Office 端口

标签 java jsp servlets openoffice.org

我有一个项目需要创建一个具有特定格式和从我的数据库中获取的特定数据的 Word (.doc) 文件。我想将该文件输出给用户,他将编辑该文件并将文件上传回服务器。之后我想对上传的文件进行如下转换。

  • .doc 到 .pdf(旨在下载并在网络上查看)
  • .doc 到 .html(用于网络上的自由文本搜索)

我想在不打开 Open Office 端口的情况下实现这一点。较早的版本是这样做的,但是当用户较多时,打开的端口有崩溃的趋势。所以我想避免这样做。 Open Office 和 OS 都在其他机器上重新安装并尝试了不同的方法,但每次用户增加时 OO 端口都会崩溃。

还有其他方法可以实现这种转换吗?由于崩溃,无法继续执行此操作。

这是主机:

  • Linux 上的 Tomcat 服务器(RedHat 64 位)
  • 应用程序是用 Java 开发的(JSP 和 Servlets)
  • 后端是甲骨文

所有用户都有:

  • Linux 机器,主要是 32 位 Fedora 或 Suse

感谢任何帮助。

最佳答案

你可以使用 http://poi.apache.org/用于处理实际的 .doc 文件。对于 PDF,也有许多可用的 PDF 库。问题是很多都不是免费的,但这里有一个开源 PDF 库列表:http://java-source.net/open-source/pdf-libraries

这里是关于 Word 到 HTML 的讨论。 Convert Word doc to HTML programmatically in Java

关于java - 创建一个 Word (.doc) 文件,将其转换为 PDF 和 HTML,无需打开 Open Office 端口,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4968904/

相关文章:

java - 将数组多次分成象限

java - 从外部 .txt 文件中流式传输大字符串,还是直接将它们编码进去更聪明?

java - servlet 无法保存到数据库

java - 如何使用Servlet和Ajax?

java - 从数据库中获取记录并自动生成树

java - JUnit 中的assertEquals(Object[], Object[]) ?

java - 如何将字符串转换为日期?

java - servlet 类的 doPost 方法没有给出所需的结果

java - 用jsp模拟真实的网页

javascript - 如何使用CSS将数字格式化为逗号分隔