ios4 - 使用 ABBYY OCR SDK 从图像中检索到的坐标不正确

标签 ios4 ocr abbyy

我正在尝试使用 ABBYY OCR SDK 处理图像,使用示例代码放置 in this question但我无法在下面的屏幕截图中获得特定单词“OCR”的正确坐标。

enter image description here

我想绘制一个覆盖层(“OCR”一词上的黄色矩形),有时该矩形距离实际单词很远。

最佳答案

您得到的XML是根据this schema合成的.

对于每个识别的字符,它将包含一个 charParams 元素的实例,如图 in the answer you linked to 。该元素将包含页面像素中的坐标 - 相同的 XML 还包含一个 page 元素:

<page width="..." height="..." resolution="..." originalCoords="...">

存储图像宽度和高度的位置。因此,每个 charParams 元素的 lr 都在相应页面的 0..width-1 范围内,并且每个 charParams 元素的 tb 位于相应页面的 0..height-1 范围内。

还值得明确指出的是,所有坐标均以像素为单位 - 它们完全与分辨率无关。这就是为什么每当您尝试突出显示图像上的任何内容时,您都必须考虑缩放 - 图像可能不会始终按设备软件的原样显示,而是会缩小,因此您必须将页面坐标映射到缩放后的图像上-输出图像坐标并适当突出显示。

关于ios4 - 使用 ABBYY OCR SDK 从图像中检索到的坐标不正确,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8679106/

相关文章:

iphone - iOS 应用程序打开时刷新 View

iphone - UILabel + touchDown

python - 在使用 OpenCv 进行图像处理期间保留字符顺序

python - 如何绘制包含文本的图像的垂直直方图 - python

php - 安比OCR SDK : I am trying a sample script for recognizing business cards but not getting any output

iphone - 如何在iPad App中显示这个?

iphone - willAnimateRotationToInterfaceOrientation 未在一个 subview 中调用,而另一个 subview 可见并已旋转

javascript - 数学图像 OCR(操作方法)

c++ - 在 ABBYY SDK 中获取字符边界框和置信度