java - 免费的开源 Java 库,用于转换 PDF - 图像、PDF - HTML、PDF - 提取图像和文本

标签 java open-source pdfbox

<分区>

我需要 Java 库来执行以下任务 1) 将 Pdf 页面转换为图像 2) 从 PDF 页面中提取 html 文本并在页面上显示这些位置 3) 从 PDF 页面中提取图像

我已经试过了

  1. PDFBox - 它因错误而失败 -- 不支持/禁用的操作:BDC 和 EMC
  2. icePDF - 它适用于任务 1) 和 3),但同样是付费的。
  3. PDFRenderer - 失败
  4. BFO - 它的付费图书馆但能够执行任务 1) 和 3)

谁能提出更好的解决方案。

最佳答案

你试过了吗JOD Converter ?它是自引导 Open Office Server 的 Java API。

要查看它是否转换为您想要的格式/从您想要的格式转换,只需安装 Open Office,打开一个文件,然后尝试“另存为”您需要的格式,看看它是否受支持。

关于java - 免费的开源 Java 库,用于转换 PDF - 图像、PDF - HTML、PDF - 提取图像和文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13134413/

相关文章:

java - FXT-009 使用 Java 通过串行端口访问 Wavecom GSM 调制解调器

Java react 时间测试 - 已过时间?

open-source - 在我的项目中使用开源代码

java - 用PDFBox写图片到pdf,发现左上角有一些奇怪的像素

java.lang.IllegalStateException : Cannot read while there is an open stream writer 错误

java - java中返回枚举的静态方法

java - 我需要使用在不同类的类内的方法中创建的多个字符串

database - 有哪些出色的在线数据库建模工具?

mysql - 在mysql源代码中,有 'DBUG_ENTER'函数,现在我使用GDB来调试服务器,如何打开 'DBUG_ENTER'开关来打印日志?

java - 突出显示文本 PDF Box Reader