<分区>
我需要 Java 库来执行以下任务 1) 将 Pdf 页面转换为图像 2) 从 PDF 页面中提取 html 文本并在页面上显示这些位置 3) 从 PDF 页面中提取图像
我已经试过了
- PDFBox - 它因错误而失败 -- 不支持/禁用的操作:BDC 和 EMC
- icePDF - 它适用于任务 1) 和 3),但同样是付费的。
- PDFRenderer - 失败
- BFO - 它的付费图书馆但能够执行任务 1) 和 3)
谁能提出更好的解决方案。
<分区>
我需要 Java 库来执行以下任务 1) 将 Pdf 页面转换为图像 2) 从 PDF 页面中提取 html 文本并在页面上显示这些位置 3) 从 PDF 页面中提取图像
我已经试过了
谁能提出更好的解决方案。
最佳答案
你试过了吗JOD Converter ?它是自引导 Open Office Server 的 Java API。
要查看它是否转换为您想要的格式/从您想要的格式转换,只需安装 Open Office,打开一个文件,然后尝试“另存为”您需要的格式,看看它是否受支持。
关于java - 免费的开源 Java 库,用于转换 PDF - 图像、PDF - HTML、PDF - 提取图像和文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13134413/