我得到了廉价相机制作的灰度图像,我需要制作一个 OCR 程序。 主要问题是噪音或不是文本但以二进制图像形式出现的对象。 现在我想到了从图像中提取文本。
为此我需要一些好的算法。 你能推荐任何真正好的吗? 例如,如果图像包含黑色文本和类似黑线的内容 那么该算法将只选择没有行的文本。
最佳答案
您描述了两种要消除的噪音。 (顺便说一下,降噪的 wikipedia page 还不错,请查看“图像”部分)。
一种是奇数点噪声。这通常被称为“ Blob ”或“椒盐”噪声,通常通过某种平均滤波器去除。在 mathworks 上有一个很好的页面描述了一些算法.
第二种是线条。这更难,我不会真正将其描述为噪音,这取决于您输入的图像类型。 This paper似乎很合适,但不能在线免费获得,因此您可能需要购买或前往本地的大学图书馆。
您可能还想看看 this ,可以从许多地方下载,但实际上是用于电影(视频)的,所以可能不是您想要的。
关于algorithm - 图片的文字检测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2593714/