java - 如何使用任何 Java 库使现有 PDF 文本可搜索?带光学字符识别

标签 java ocr pdfbox

有java库吗? 如何使用任何 java 库制作可搜索的文本? 开源或付费。

如何使用 PDFBox 将 OCR 应用于 pdf? 如何使用 pdfbox 以编程方式使 pdf 文本可搜索 我搜索了很多。没有找到任何解决办法。 谁能粘贴 OCR PDFBox 的代码。

最佳答案

尝试Apache PDFBox .

提取文本:Textextraction .

关于java - 如何使用任何 Java 库使现有 PDF 文本可搜索?带光学字符识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22862704/

相关文章:

Android PhoneGap OCR 插件

java - 如何在java中检查文件是否受密码保护/加密

java - 如何使用pdfbox获取页面内容高度

java - 输入/比较字符串、返回数字、Java

javascript - spring mvc ajax 错误请求错误

java - 使用 Java 从版本升级我的 PDF 文件

c# - .NET是否有任何免费的OCR API?

java - Morphia - 更改与集合关联的类

java - Tesseract 无法将数据复制到 SD?

java - 为什么pdf只包含一个字段大约500Kb