我一直在互联网上搜索如何使用 Java 将 HTML 页面转换为 PDF 文件。我找到了很多指示,简而言之,它们不起作用或难以实现。我还下载了一个商业产品,pdf4ml; API 是我很乐意使用的东西,除了当我在维基百科上抓取一个简单页面时,我遇到内存不足错误(将 Xmx 设置为 1024 M)。在某些方法中,他们建议转换 HTML -> XHTML -> FO -> PDF。但是,我收到了很多关于 XHTML-to-FO XLS 文件的异常(exception)情况;并阅读文档,这不是我现在有足够时间理解的东西。
这是我的问题/疑虑。 1. 是否有另一个可以轻松将 HTML 转换为 PDF(商业或非商业)的内聚 API? 2. 有没有一种方法可以简单地捕获 HTML 页面并将其存储为单个文件。这种方法类似于使用 Internet Explorer 将网页保存为 Web 存档(单个文件,MHT 格式)的方式?
任何帮助表示赞赏。 (顺便说一句,我知道这个问题已经被反复问过,但除了问题的原始精神之外,我还对其他方式持开放态度)。谢谢。
最佳答案
尝试 wkhtmltopdf ,它正在使用 WebKit。另一个选项(我目前正在使用)是使用 OpenOffice(通过宏进行远程控制)。
关于java - 如何使用 Java 将 HTML 网页转换为 PDF 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5386591/