是否可以使用 Tensorflow.js 进行实时 OCR 语言建模(从英语开始),因为我愿意让客户端本地桌面应用程序在离线模式下运行。?其背后的动机是为了避免不必要的网络资源消耗并具有更高的安全级别。我尝试捆绑 Tesseract.js,但它不是实时的,并且在各自的论坛中没有太多事件。在这方面的任何指示都会有很大的帮助。
最佳答案
定义“实时”。如果您指的是网络摄像头上的每一秒,那么是的!如果您想要原生性能,您应该考虑使用 TFLite 的移动应用程序。大多数情况下每秒运行一次是可以接受的。
我建议将现有的 TF 模型转换为 TFJS 以供您研究。就像这个:https://github.com/tensorflow/models/tree/master/research/attention_ocr
或者您可以自己训练,例如 TFJS 中的经典 MNIST 示例,参见此处:https://storage.googleapis.com/tfjs-examples/mnist/dist/index.html
关于javascript - 用于 OCR 的 Tensorflow.js,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50344844/