我正在开发一个 OCR 项目。我的第一个任务是从 iPhone 相机拍摄图像,然后在图像上找到特定的单词。
下面是我的设备拍摄的示例图像,现在我想找到单词“STATIONERY”的位置,并在图像上用黄色矩形突出显示它。
我怎样才能做到这一点?我是否需要首先使用 OCR SDK(例如 ABBYY)或者我可以通过其他方式执行此操作吗?
最佳答案
如果需要获取特定单词的坐标,当然需要先进行OCR。请记住,由于其底部部分,您可能会对附加的特定图像遇到一些困难。 OCR 在简单相似的背景下效果很好。
关于 OCR SDK - 尝试 ABBYY Cloud OCR SDK ,它是ABBYY最近推出的基于云的OCR SDK。它处于测试阶段,因此目前完全免费使用,并且有一个随时可用的 iOS code samples .
它有一个内置的 xml 格式的坐标提取功能,我已经裁剪了图像的底部部分以使背景变得简单并将其发送到 SDK,这是我得到的响应:
<charParams l="35" t="39" r="73" b="83" charConfidence="100">S</charParams>
<charParams l="77" t="39" r="117" b="83" charConfidence="100">T</charParams>
<charParams l="120" t="40" r="164" b="83" charConfidence="100">A</charParams>
<charParams l="165" t="40" r="204" b="83" charConfidence="100">T</charParams>
<charParams l="211" t="40" r="225" b="83" charConfidence="100">I</charParams>
<charParams l="231" t="40" r="276" b="84" charConfidence="100">O</charParams>
<charParams l="285" t="41" r="325" b="84" charConfidence="100">N</charParams>
<charParams l="334" t="42" r="370" b="84" charConfidence="100">E</charParams>
<charParams l="377" t="42" r="419" b="85" charConfidence="100">R</charParams>
<charParams l="428" t="42" r="469" b="84" charConfidence="100">Y</charParams>
这些“l”,“t”,“r”,“b”参数代表左,上,右和下,它们描述了每个字符的一个矩形,具有左上角和右下角。我相信这正是您正在寻找的。p>
关于ios - 如何突出显示相机 View 拍摄的图像上的一大块文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8653770/