vb6 - 如何验证VB 6可执行文件的2个副本来自同一代码库?

标签 vb6 md5 hash md5sum binary-reproducibility

我有一个受版本控制的程序,该程序已通过多个发行版。今天出现了一种情况,有人以某种方式设法指向该程序的旧副本,因此遇到了自此以来已修复的错误。我想回过头来,只删除该程序的所有旧副本(保留它们是一项公司政策,该政策始于版本控制常见之前,因此不再需要),但是我需要一种验证方式生成完全相同的可执行文件,总比说“旧文件来自此提交,因此该文件应该相同”要好。

我最初的想法是简单地用MD5对可执行文件进行哈希处理,然后将哈希文件存储在源代码管理中并完成它,但是我遇到了一个我什至无法解析的问题。

似乎每次生成可执行文件(方法:打开项目。文件> Make X.exe)时,其哈希值都不同。我注意到,每次项目以看似随机的方式打开时,Visual Basic都会将文件弄乱,但是我不认为这会使它成为可执行文件,也没有任何证据表明确实如此。为了防止这种情况发生,我尝试在同一IDE session 中多次生成可执行文件并检查哈希,但每次哈希值仍然不同。

所以那是:

  • 生成可执行的
  • 生成MD5校验和:md5sum X.exe > X.md5
  • 验证MD5是否为当前可执行文件:md5sum -c X.md5
  • 生成新的可执行
  • 验证MD5是否有新的可执行文件:md5sum -c X.md5
  • 验证失败,因为计算的校验和不匹配。

  • 我不了解MD5或VB 6生成可执行文件的方式,但我也对使用MD5的想法不满意。如果有更好的方法来验证两个可执行文件确实相同,那么我将不胜枚举。

    在此先感谢您的帮助!

    最佳答案

    那几乎是不可能的。继续阅读为什么。

    每次,编译器都会赢得这场比赛。

    即使不对源代码或项目设置进行任何更改,连续两次编译同一项目也总是会产生不同的可执行文件。

    原因之一是Windows用于EXE文件的PE(便携式可执行文件)格式包括指示EXE生成日期和时间的时间戳,只要您构建项目,该时间戳就会由VB6编译器更新。除了整个EXE的“主”时间戳外,EXE中的每个资源目录(图标,位图,字符串等存储在EXE中)也具有一个时间戳,编译器在构建新的时间戳时也会对其进行更新。 EXE文件。除此之外,EXE文件还具有一个校验和字段,编译器根据EXE的原始二进制内容重新计算该校验和字段。由于时间戳已更新为当前日期/时间,因此,每次重新编译项目时,EXE的校验和也会更改。

    但是,但是...我发现了这个非常酷的EXE编辑工具,它可以消除编译器的欺骗性!

    有EXE编辑工具,例如PE Explorer,声称可以将EXE文件中的所有时间戳调整为固定时间。乍一看,您可能会认为您可以将EXE的两个副本中的时间戳设置为相同的日期,并得到等效的文件(假设它们是从相同的源代码构建的),但是事情要比这复杂得多:每次编译代码时,编译器可以自由地以不同的顺序写出资源(字符串,图标,文件版本信息等),并且您无法真正防止这种情况的发生。资源存储为独立的数据“块”,可以在生成的EXE中对其进行重新排列,而不会影响程序的运行时行为。

    如果这还不够,那么编译器可能会在未初始化的内存区域中建立EXE文件,因此EXE的某些部分可能包含编译器运行时内存中的零碎内容,从而创建了更多内容。差异。

    至于MD5 ...

    您不会误解MD5散列:给定相同的输入,MD5将始终产生相同的散列。这里的问题是这种情况下的输入(EXE文件)不断变化。

    结论:源代码控制是您的 friend

    至于解决当前的难题,我将留给您:将特定的EXE与特定版本的源代码相关联只是一个政策问题,必须以某种方式强制执行,而不是其他任何事情。试图找出没有任何上下文的EXE来自哪个版本只是不可靠。您需要在其他工具的帮助下进行跟踪。例如,确保每个内部版本都为您的EXE生成不同的版本号,并且可以轻松地将该版本与版本控制系统中的特定修订版/分支/标记/所有版本配对。为此,出现了“免费提供”的情况,其中一些开发人员使用源代码管理,而其他开发人员则使用“我保留在网络文件夹中的1997年源代码的副本,因为这是我的代码,源代码控制是针对麻烦的”无论如何”都无济于事。我会让每个人都喝喝源代码控制Kool-Aid,并遵循立即创建构建的标准策略。

    每当我们构建项目时,我们的构建服务器(我们使用Hudson)都会确保已编译的EXE版本已更新为包括当前的内部版本号(我们使用Version Number Plugin和一个自定义的构建脚本来执行此操作),并且当我们发布构建时,我们使用版本号作为标签名称在Subversion中创建标签。构建服务器存档发布了构建,因此我们始终可以获取提供给客户的特定EXE(和安装程序)。对于内部测试,我们可以选择从构建服务器中提取一个已存档的EXE,或者只是告诉构建服务器从我们在Subversion中创建的标记中重建EXE。

    我们也永远不会从构建服务器以外的任何计算机上将任何二进制文件发布给QA或客户。这样可以防止“在我的机器上工作”错误,并确保我们始终从源代码的“已知”副本进行编译(它仅提取和构建Subversion存储库中的代码),并且始终可以关联给定的二进制文件,其中包含从中创建代码的确切版本。

    关于vb6 - 如何验证VB 6可执行文件的2个副本来自同一代码库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2834686/

    相关文章:

    sql - Paradox DB SQL 多重联接

    ruby-on-rails - 数组和哈希有什么区别?

    android - 使用私钥、RSA-SHA1 签名和 Android 中的 md5 签名字符串

    python - 如何使用 python 中的现有哈希器更新 hashlib.md5 哈希器?

    java - 保证在HashSet中均匀分布散列,它是如何工作的?

    java - 如果数组列表中没有唯一元素,我需要打印 Null

    vb.net - 从 VB6 迁移到 .NET,TreeNode.FirstSibling 是否有等效功能?

    Vb6:通过浏览按钮选择稍后使用的文件

    string - 在 Visual Basic 6 中,如何删除字符串的第一个字符?

    php - 使用md5生成优惠券?