ios - 如何突出显示相机 View 拍摄的图像上的一大块文本

标签 ios ios4 ocr quartz-graphics

我正在开发一个 OCR 项目。我的第一个任务是从 iPhone 相机拍摄图像,然后在图像上找到特定的单词。

下面是我的设备拍摄的示例图像,现在我想找到单词“STATIONERY”的位置,并在图像上用黄色矩形突出显示它。

我怎样才能做到这一点?我是否需要首先使用 OCR SDK(例如 ABBYY)或者我可以通过其他方式执行此操作吗?

screenshot of image taken by camera

最佳答案

如果需要获取特定单词的坐标,当然需要先进行OCR。请记住,由于其底部部分,您可能会对附加的特定图像遇到一些困难。 OCR 在简单相似的背景下效果很好。

关于 OCR SDK - 尝试 ABBYY Cloud OCR SDK ,它是ABBYY最近推出的基于云的OCR SDK。它处于测试阶段,因此目前完全免费使用,并且有一个随时可用的 iOS code samples .

它有一个内置的 xml 格式的坐标提取功能,我已经裁剪了图像的底部部分以使背景变得简单并将其发送到 SDK,这是我得到的响应:

<charParams l="35" t="39" r="73" b="83" charConfidence="100">S</charParams>
<charParams l="77" t="39" r="117" b="83" charConfidence="100">T</charParams>
<charParams l="120" t="40" r="164" b="83" charConfidence="100">A</charParams>
<charParams l="165" t="40" r="204" b="83" charConfidence="100">T</charParams>
<charParams l="211" t="40" r="225" b="83" charConfidence="100">I</charParams>
<charParams l="231" t="40" r="276" b="84" charConfidence="100">O</charParams>
<charParams l="285" t="41" r="325" b="84" charConfidence="100">N</charParams>
<charParams l="334" t="42" r="370" b="84" charConfidence="100">E</charParams>
<charParams l="377" t="42" r="419" b="85" charConfidence="100">R</charParams>
<charParams l="428" t="42" r="469" b="84" charConfidence="100">Y</charParams>

这些“l”,“t”,“r”,“b”参数代表左,上,右和下,它们描述了每个字符的一个矩形,具有左上角和右下角。我相信这正是您正在寻找的。

关于ios - 如何突出显示相机 View 拍摄的图像上的一大块文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8653770/

相关文章:

ios - NSThread sleepfortimeinterval 阻塞主线程

ios - 如何使用 Swift 4 在 UITextfield 中实现 Material chips

ios - 如何处理完成处理程序 block 中已取消的 NSURLSessionTask?

iphone - 如何自定义EKEventViewController的UITableView?

iphone - iOS 4 的透明应用程序图标?

java - tess4j 中缺少 slf4j

ios - 如何在 Windows 上调试 iPad Flash 应用程序?

iphone - iOS 4.3 中的 HTTP 代理身份验证

opencv - 提高低质量扫描图像的 OCR 质量

iphone - 使用Iphone相机识别特定位置的文本