我正在尝试使用 ABBYY OCR SDK 处理图像,使用示例代码放置 in this question但我无法在下面的屏幕截图中获得特定单词“OCR”的正确坐标。
我想绘制一个覆盖层(“OCR”一词上的黄色矩形),有时该矩形距离实际单词很远。
最佳答案
您得到的XML是根据this schema合成的.
对于每个识别的字符,它将包含一个 charParams
元素的实例,如图 in the answer you linked to 。该元素将包含页面像素中的坐标 - 相同的 XML 还包含一个 page
元素:
<page width="..." height="..." resolution="..." originalCoords="...">
存储图像宽度和高度的位置。因此,每个 charParams
元素的 l
和 r
都在相应页面的 0..width-1
范围内,并且每个 charParams
元素的 t
和 b
位于相应页面的 0..height-1
范围内。
还值得明确指出的是,所有坐标均以像素为单位 - 它们完全与分辨率无关。这就是为什么每当您尝试突出显示图像上的任何内容时,您都必须考虑缩放 - 图像可能不会始终按设备软件的原样显示,而是会缩小,因此您必须将页面坐标映射到缩放后的图像上-输出图像坐标并适当突出显示。
关于ios4 - 使用 ABBYY OCR SDK 从图像中检索到的坐标不正确,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8679106/