python - 如何获取文件夹中的所有文件并在 python 中获取它们的 MD5 哈希值?

标签 python md5

我正在尝试编写一些代码来获取文件夹中每个 exe 文件的 md5。

我的问题是我不知道该怎么做。仅当文件夹仅包含一个文件时才有效。这是我的代码:

import glob
import hashlib
file = glob.glob("/root/PycharmProjects/untitled1/*.exe")

newf = str (file)
newf2 =  newf.strip( '[]' )
newf3 = newf2.strip("''")

with open(newf3,'rb') as getmd5:
    data = getmd5.read()
    gethash= hashlib.md5(data).hexdigest()
    print gethash

我得到了结果:

a7f4518aae539254061e45424981e97c

我想知道如何对文件夹中的多个文件执行此操作。

最佳答案

glob.glob 返回文件列表。只需使用 for 遍历列表:

import glob
import hashlib

filenames = glob.glob("/root/PycharmProjects/untitled1/*.exe")

for filename in filenames:
    with open(filename, 'rb') as inputfile:
        data = inputfile.read()
        print(filename, hashlib.md5(data).hexdigest())

请注意,如果您碰巧在该目录中有一个大文件,这可能会耗尽您的内存,所以它是 better to read the file in smaller chunks (此处针对 1 MiB block 进行了调整):

def md5(fname):
    hash_md5 = hashlib.md5()
    with open(fname, "rb") as f:
        for chunk in iter(lambda: f.read(2 ** 20), b""):
            hash_md5.update(chunk)
    return hash_md5.hexdigest()

for filename in filenames:
    print(filename, md5(filename))

关于python - 如何获取文件夹中的所有文件并在 python 中获取它们的 MD5 哈希值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36099331/

相关文章:

php - PHP的MD5哈希函数返回500内部错误

python - 新的 Pipenv 导致我之前的 virtualenvwrapper 损坏

python - 为什么setup.py被pip执行了两次?

c# - Azure 存储的文件与本地文件具有不同的 MD5 校验和(是同一文件)

MySQL:在查询中使用之前对值列表进行排序

md5 - MD5密码哈希函数输出在所有编程语言中都一样吗?

iphone - 通过MD5算法加密成Unicode(UCS-16)格式的32位字符串

python - JSON 解码字符串

python - Django 模板和本地技巧

python - 计算 pandas 数据帧列中某个字符的出现次数