另一个样本
另一个样本
上图是我试图从中提取所有数字的另一张图片的输出。我正在单独选择每个数字,执行图像转换(阈值处理、图像对比、平均然后对比),但似乎没有一个能提供可靠和稳健的输出。
使用阈值效果很好,但提取数字的亮度并不总是相同,因此需要调整阈值以使其准确。我需要每次都能正常工作的东西。我正在寻找的输出类似于下图。执行图像转换后,图像通过 Tesseract OCR 运行。当通过 Tesseract 放置下图等时,输出几乎总是正确的。
此外,并非所有数字的大小都相同。无论数字的大小如何,我都需要它来工作。谁能帮忙?
最佳答案
不,你可能不需要自己做所有这些,OpenCV 已经实现了 OTSU 二值化方法,这完全适合你的情况。基本上它假设输入强度分布是双峰的。因此试图找到最佳阈值。您可以阅读更多 here .这是小代码以及生成的输出。
import cv2
img = cv2.imread("/home/abc/Downloads/1ltYB.png", 0)
ret, thresh = cv2.threshold(img, 10, 255, cv2.THRESH_OTSU)
print "Threshold selected : ", ret
cv2.imwrite("./debug.png", thresh)
输入:(我裁剪了图像以移除多余的填充)
输出:
关于python - 从图像中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41969502/