感谢您查看我的问题。
基本上我想做的是找到所有看起来像第一张和第三张图像的图像:/image/Nl5lp.jpg
并删除所有看起来不像的 (2,4)。
我尝试了几个库都无济于事。
另一种可接受的方法是检查图像是否包含“Code:”,因为该字符串存在于我必须整理的每个图像中。
谢谢你, 史蒂夫
编辑:虽然第一张和第三张图像看起来大小相同,但实际上并非如此。
最佳答案
如果这些是您要使用的实际图像,那么直方图相似度似乎可以完成这项工作。第一个和第三个反差很大,第二个和第四个,特别是第四个,有很大范围的不同强度。
您可以轻松地制作图像中灰色阴影的直方图,然后对直方图的形状应用阈值以对其进行分类。
编辑:要实际执行此操作:您可以迭代每个像素并创建一个像素值数组 => 找到的次数。由于它是灰度的,因此您可以采用 R、G 或 B channel 。然后将每个数字除以图像中的像素数进行标准化,这样它就适用于任何尺寸。直方图中的每个条目将是所使用的像素数的一小部分。然后,您可以测量高于特定阈值的值的数量。如果有很多灰色,您将获得大量小值。如果没有,您将获得少量大值。
关于php - 对非常相似的图像进行排序 PHP OCR,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12992432/