image-processing - 如何增强嘈杂图像的颜色和对比度

标签 image-processing ocr image-segmentation pattern-recognition

我之前问过这个问题“如何从图像中提取数字”LINK最后我完成了这一步,但是当我尝试识别数字时,有一些测试用例会导致糟糕的输出。以这张图片为例

enter image description here

这张图片的对比度很低(来 self 的 POV)我试图调整它的对比度,结果仍然 Not Acceptable 。我也尝试锐化它然后我应用了 Gamma 校正但结果仍然不公平,所以提取的数字不被分类器很好地识别

这是(锐化 + Gamma )之后的图像

enter image description here

分离后的4号:

enter image description here

谁能告诉我解决此类问题的最佳想法是什么?

最佳答案

锐化并不总是解决此类问题的最佳工具。与名称所暗示的相反,锐化不会“恢复”信息以将细节和边缘添加回图像。相反,锐化是一类增加边缘局部对比度的操作。

因为您的原始图像已经严重退化,这种锐化操作看起来会添加很多噪声,而且通常不会使任何东西变得更好。

还有另一类算法称为“去模糊”算法,它们试图通过(复杂得多的)数学模型实际重建图像细节。它的一些版本是盲反卷积、正则化反卷积和维纳反卷积。

但是,重要的是要注意所有这些方法都是近似值——一旦图像内容通过模糊等操作丢失,它(几乎)永远无法完全恢复。此外,这些方法通常要复杂得多。

处理这些情况的最佳方法是确保它们永远不会发生。确保图像捕获期间的良好对焦,使用分辨率非常适合您的任务的系统,控制照明环境。然而,当这些方法不起作用或不能起作用时,就需要图像重建技术。

关于image-processing - 如何增强嘈杂图像的颜色和对比度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21175557/

相关文章:

android - Android 中的小插图

python - TensorFlow "tf.image"在 4D 图像批处理上运行

python - 如何将类别矩阵可视化为 RGB 图像?

swift - S4TF 中的 softmax 交叉熵

image-processing - MTCNN 与 DLIB 在人脸检测方面的表现如何?

opencv - 查找将3D局部坐标映射到全局坐标的转换矩阵

ocr - 为位图字体文件中的每个字形生成标记图像

python - 使用 cv2 填充字符中的空白

algorithm - 图片的文字检测

python - 如何提取图像的边界(OCT/视网膜扫描图像)