linux - 使用 tesseract v3 通过可搜索文本命令行创建 pdf 文档

标签 linux command-line ocr tesseract

我们正在使用 tesseract 从 tiff 扫描文档中提取文本,我们使用 tesseract 命令行选项启动它,但是我们希望使用 Tesseract V3.0 将此 tiff 扫描文档转换为带有可搜索文本的 PDF,并且我们还需要使用命令行来获取它。

我们的系统是 Ubuntu 12 服务器,关于如何获得它有什么想法吗?我们一直在Tesseract V3.0 Datasheet中进行搜索,但未能正确理解。

你们中有人遇到过类似的事情吗?

提前非常感谢!

最佳答案

您将需要Tesseract v3.03 用于生成可搜索的 PDF。

关于linux - 使用 tesseract v3 通过可搜索文本命令行创建 pdf 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23065506/

相关文章:

c++ - 怎么知道哪段内存全为零

linux - 为什么我的 awk 命令多打印一行?

php - 在php中执行unlink函数时,Linux中是否出现目录错误

android - 无法写入输出 : Too many methods: 66156; max is 65536. By package: android

python - 为 OCR 对齐文本

php - UTF-8贯穿始终

windows - 如何用命令行参数字符串替换bat文件中的字符串

ruby-on-rails - 具有非 HTTP 访问权限的 Rails 应用

python - 如何使用 pytesseract 从图像中读取数字

Java OpenCV + Tesseract OCR "code"识别