我有这张图
如何进行OCR呢? 我知道这非常具有挑战性,但我非常感谢任何帮助。
最佳答案
如果你有时间自己开发检测,我会大致这样做:
- 获取 1000 张左右的图像,然后自己对它们进行 OCR,或者让 Amazon Mechanical Turk 上的人员为您完成,这几乎不需要任何费用。现在您可以调整算法并衡量您的表现。
- 就像 Ryan 写的那样,手动或使用类似 http://www.roborealm.com/ 的东西玩标准图像过滤器、对比度、颜色、高斯等。 .看看您能否找到使文本真正脱颖而出的组合。
- 再次尝试库
- 如果库仍然不起作用,请尝试使用您对图片的了解将其拆分为单独的数字。您知道应该有多少位数字以及每个数字应该占用多少像素。使用边缘检测或其他方法(也许标准的 OCR 特征提取,连同聚类会给你每个数字作为一个集群?)来找到数字并将它们分开。
- 对每个数字进行标准的 OCR 特征提取(不要太有创意 - 使用现有库或至少阅读最常见和最简单的特征)并提供这些特征,以及您在 1 以下得到的答案)进入神经网络或支持向量机。
- 改进您的功能集,直到机器学习发挥作用。
由于您只有十位数字,图像之间的数字相当一致,因此这应该可行。
关于c# - 如何OCR雕刻文字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13630114/