python - 是否可以检测重复的图像文件?

标签 python image

我有超过 10K 个产品文件,问题是很多图片都是重复的。

如果没有图像,则有一个标准图像,上面写着“没有图像”。

如何检测图像是否为标准的“无图像”图像文件?

更新 该图像是一个不同的名称,但它是完全相同的图像。

人们都在说哈希,那么我会这样做吗?

im = cStringIO.StringIO(file.read())
img = im.open(im)
md5.md5(img)

最佳答案

作为旁注,对于图像,我发现栅格数据散列比文件散列更有效。

ImageMagick 提供了可靠的方法来计算此类哈希值,并且有不同的 python 绑定(bind)可用。它有助于检测具有不同无损压缩和不同元数据的相同图像。

使用示例:

>>> import PythonMagick
>>> img = PythonMagick.Image("image.png")
>>> img.signature()
'e11cfe58244d7cf98a79bfdc012857a9391249dca3aedfc0fde4528eed7f7ba7'

关于python - 是否可以检测重复的图像文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3383892/

相关文章:

java - 如何在电子邮件正文中显示图像?

python - 文本小部件填充一半屏幕

python - 在 Windows 上测量每个线程的 CPU 时间

c# - 如何将图像插入到 OpenXML Word 文档的页眉中?

java - 在java中使用缩放来提高jpeg图像质量

android - 如何在不使用渲染脚本的情况下模糊图像的特定部分,因为我的 minsdk 是 14。

Image.prefetch 不会自动从缓存中加载 [React-Native/Expo]

python - fatal error : Python. h:没有这样的文件或目录

python - 如何在 python 中创建自定义列表类?

python - 将 {} 绑定(bind)到 future 版本的 dict()