我在 OCR 方面遇到了一个奇怪的问题。基本上,我通过服务器将 jpg 从 iPhone 应用程序发布到 OCR 端点(ocrapiservice.com,FWIW)。该照片包含漂亮、清晰的打字文本,尺寸足够大(2500 奇数像素宽)。然而,结果是难以理解的:
n. E o U > CO CO a £ O a p a h o .8 U o...
如果我将相同的图像上传到 ocrapiservice 的测试门户(图像从 iPhone 到达我的服务器后,我会通过电子邮件给自己发送该图像的副本),结果是相同的。
我在 Photoshop 中打开同一张图像,无需执行任何其他操作,就使用不同的文件名“另存为”。文件大小几乎翻倍 ( for this reason, I guess )。现在,如果我上传这张图像,结果近乎完美,没有随机字符或难以理解的位。
总而言之,这两个图像具有相同的尺寸、分辨率、色彩空间等。唯一的区别是我在 Photoshop 中另存为图像,文件大小增加了一倍。
另一个奇怪的方面是,如果我在 Photoshop 中另存为,但选择中等 jpeg 压缩级别,导致新文件大小与原始图像大致相同,则另存为图像仍然提供良好的效果结果,而相同大小的原件却是乱码。
我不知道 Photoshop 有什么魔力让这些图像能够很好地被 OCR 读取,但是任何指导将非常感激!特别是有关如何在 iPhone 应用程序中对 UIImage 数据有效执行相同操作以使 OCR 在直接 POST 时工作的提示。
谢谢!
最佳答案
谢谢你们的快速回复,伙计们。事实证明这是图像方向的问题。 Photoshop 会读取 iPhone 设置的标志并相应地修复方向,而发布图像则直接丢弃它。应该知道!
关于ios - iPhone 图像与 Photoshop 中的同一图像 "saved-as"之间的 OCR 结果不同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11961100/