我们正在使用 tesseract 从 tiff 扫描文档中提取文本,我们使用 tesseract 命令行选项启动它,但是我们希望使用 Tesseract V3.0 将此 tiff 扫描文档转换为带有可搜索文本的 PDF,并且我们还需要使用命令行来获取它。
我们的系统是 Ubuntu 12 服务器,关于如何获得它有什么想法吗?我们一直在Tesseract V3.0 Datasheet中进行搜索,但未能正确理解。
你们中有人遇到过类似的事情吗?
提前非常感谢!
最佳答案
您将需要Tesseract v3.03 用于生成可搜索的 PDF。
关于linux - 使用 tesseract v3 通过可搜索文本命令行创建 pdf 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23065506/