我们开发了一个使用 OCR 技术的网络应用程序。我们使用付费的 API 服务,效果很好。 我们的后端/服务器使用基于 Ruby/Rails 的 API,我们的前端/客户端使用 VUE.js。 现在 OCR 技术是服务器端的,但我们也想进军离线/PWA(渐进式网络应用程序)市场,目前正在开发我们应用程序的离线版本。由于我们应用程序的 OCR 部分必须在客户端运行,我们会将 OCR 技术也转移到客户端,这意味着我们必须使用某种 PWA 兼容的 OCR 技术,例如一个 JavaScript SDK
我可能已经搜索了整个互联网,但似乎没有真正的解决方案。这一切都归结为两个主要 vendor :
- tesseract/可能是最大的 OCR 项目(开源)。他们提供了一个 JS SDK (tesseract.js) -> http://tesseract.projectnaptha.com/但这很糟糕。我们将结果与我们正在使用的 API 进行了比较,结果很糟糕。因此,我们不能使用它。
- ABBYY 可能是网络上最著名的 OCR 提供商,他们以合理的价格提供 OCR 扫描服务。不幸的是,在调用他们之后,他们也没有为 PWA 提供任何解决方案,仅针对 native 应用程序
- 不幸的是,许多其他小项目使用了除 JS 库之外的所有东西
在放弃并考虑开发 native 应用程序(这对我们来说将是报价成本密集型)之前,我考虑过在这里询问是否有任何已知的 PWA 的 OCR 解决方案,但我还没有考虑过。谢谢
最佳答案
您可以使用 ocrad.js 开源 javascript OCR 库:http://antimatter15.com/ocrad.js/demo.html | https://github.com/antimatter15/ocrad.js
它的大小为 3mb,但它在许多示例中运行良好。
关于javascript - 渐进式网络应用程序 OCR SDK (JavaScript),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47530264/