algorithm - 图片的文字检测

标签 algorithm image-processing ocr

我得到了廉价相机制作的灰度图像,我需要制作一个 OCR 程序。 主要问题是噪音或不是文本但以二进制图像形式出现的对象。 现在我想到了从图像中提取文本。

为此我需要一些好的算法。 你能推荐任何真正好的吗? 例如,如果图像包含黑色文本和类似黑线的内容 那么该算法将只选择没有行的文本。

最佳答案

您描述了两种要消除的噪音。 (顺便说一下,降噪的 wikipedia page 还不错,请查看“图像”部分)。

一种是奇数点噪声。这通常被称为“ Blob ”或“椒盐”噪声,通常通过某种平均滤波器去除。在 mathworks 上有一个很好的页面描述了一些算法.

第二种是线条。这更难,我不会真正将其描述为噪音,这取决于您输入的图像类型。 This paper似乎很合适,但不能在线免费获得,因此您可能需要购买或前往本地的大学图书馆。

您可能还想看看 this ,可以从许多地方下载,但实际上是用于电影(视频)的,所以可能不是您想要的。

关于algorithm - 图片的文字检测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2593714/

相关文章:

algorithm - 计算数组的相邻幂集

algorithm - 白平衡(色彩抑制)公式?

ios - 适用于 iOS 的 OCR 文本阅读器

LCD字符的Linux OCR

python-imaging-library - 如何为 OCR 增强 Tesseract 自动文本旋转功能?

algorithm - 在 O(logn) 中查找合并数组中的中间元素

algorithm - Travelling Salesman 的最大化版本,您不必前往某些节点并且可以通过多条路径?

java - 如何在hadoop中获取像素rgb值?

algorithm - 500 个数字最快的简单排序算法(快速排序/合并排序除外)是什么?

image - 在matlab中,colormap对图像没有影响