java - 如何使用 Java 将 HTML 网页转换为 PDF 文件

标签 java pdf

我一直在互联网上搜索如何使用 Java 将 HTML 页面转换为 PDF 文件。我找到了很多指示,简而言之,它们不起作用或难以实现。我还下载了一个商业产品,pdf4ml; API 是我很乐意使用的东西,除了当我在维基百科上抓取一个简单页面时,我遇到内存不足错误(将 Xmx 设置为 1024 M)。在某些方法中,他们建议转换 HTML -> XHTML -> FO -> PDF。但是,我收到了很多关于 XHTML-to-FO XLS 文件的异常(exception)情况;并阅读文档,这不是我现在有足够时间理解的东西。

这是我的问题/疑虑。 1. 是否有另一个可以轻松将 HTML 转换为 PDF(商业或非商业)的内聚 API? 2. 有没有一种方法可以简单地捕获 HTML 页面并将其存储为单个文件。这种方法类似于使用 Internet Explorer 将网页保存为 Web 存档(单个文件,MHT 格式)的方式?

任何帮助表示赞赏。 (顺便说一句,我知道这个问题已经被反复问过,但除了问题的原始精神之外,我还对其他方式持开放态度)。谢谢。

最佳答案

尝试 wkhtmltopdf ,它正在使用 WebKit。另一个选项(我目前正在使用)是使用 OpenOffice(通过宏进行远程控制)。

关于java - 如何使用 Java 将 HTML 网页转换为 PDF 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5386591/

相关文章:

java - Jooq中的一对多选择

java - 抛出 Swing 异常时显示对话框

java - 如果输出可以用 XML 或 JSON 表示,则使用什么 API

PDF 中的 Javascript

c# - 如何从pdf c#中获取具有特定颜色的文本#

java - 网络字节序到主机字节序转换Java

java - "cleanup code"是什么意思?

php - Imagick 和 phmagick : Postscript delegate failed/No such file or directory 问题

angular - 无法在 jsPDF 的 addImage() 函数上为多个页面添加边距

iphone - 在 iphone 应用程序中从 UIView 创建 PDF 会出现异常