iphone - 实时图像处理 (OCR)

标签 iphone ios image-processing ocr augmented-reality

<分区>

我正计划开发类似 Word Lens 的应用程序.谁能推荐一个我可以使用的好图书馆?或任何人解释 Word Lens App 背后的技术?是卷轴时间图像匹配还是 OCR?我知道一些图像处理库,如 OpenCv、tesseract...非常感谢任何帮助...

最佳答案

我是 Word Lens 的创建者之一。虽然有一些 OCR 库(如 tesseract),但我们决定自己制作以获得更好的结果和性能。我们的一般算法是这样的:

  1. 从相机复制图像并获取其灰度分量
  2. 拉平图片,使文字在背景中清晰可见
  3. 在看起来像字符和句子的东西周围画框
  4. 进行 OCR:将每个框中的像素与字符数据库进行匹配——这实际上非常困难!
  5. 将字符收集成单词,查字典(这个也很难,因为OCR会出错)
  6. 将结果绘制回图像上

图像匹配本身是不够的,因为那里有各种各样的字体、文字和语言。

OpenCV 是一个很棒的库,可以用来启动和运行,并从总体上了解有关计算机视觉的更多信息。我会建议建立他们的例子,并在那里玩。玩得开心!

关于iphone - 实时图像处理 (OCR),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15656331/

相关文章:

iphone - 仅适用于 iPad 的应用程序

ios - 如何将 Cocoa Touch 静态库链接到 MonoTouch 项目?

ios - 如何在导航栏上添加滑动菜单关闭按钮

image - 使用 nlfilter 函数时如何输出结构数组?

iphone - NSString initWithData 在额外的引号中返回字符串值,如何解决?

iphone - CATransaction 未观察到 CALayer 子类上的属性

ios - 自动无限 collectionView - 闪烁

ios - 在 Storyboard 中将 Segue 拖到自身

OpenCV 裁剪图像

php - 在 PHP imagepng 中禁用 SSL