assembly - 为什么 .COM 程序中只有一个段,既用于程序代码又用于堆栈?

标签 assembly dos x86-16 memory-segmentation

我正在研究 .EXE 程序和 .COM 程序之间的区别。 .EXE 对我来说是合乎逻辑的,堆栈位于程序代码的另一个段中(实际上堆栈是强制的,并用 .STACK 指示此限制),因此,当我去插入值时堆栈(在 .EXE 中),使用与程序不同的段,我不会混淆这两者。

例子:

SP = 0400
SS = 3996 CS = 3995 IP = 0000

栈的容量为1024 Byte(400h),指栈段3996h,与代码段3995h不同。所以我确信数据不会混淆。

但我不明白的是,当我必须处理 .COM 程序时;因为我很清楚他们只使用一个段,我发现自己遇到了类似这样的情况:

SP = FFEE
SS = 114A CS = 114A IP = 0100

我有与代码段匹配的堆栈段。因此,如果我一直将值放在堆栈上,它们迟早会出现在我的代码中吗?

最佳答案

虽然 MS-DOS 在加载 COM 文件后在程序入口处确实将所有段寄存器设置为同一段,但没有什么可以阻止您更改寄存器以使用不同的段。然而,您所设想的分割市场之间的硬分离实际上并不存在。即使有一个单独的堆栈段,如果您的堆栈溢出,您仍然会写入内存中不应该的地方,结果将是不可预测的。

使用 CS:IP 为 114A:0100 和 SS:SP 为 114A:FFFE 的第二个示例,您的 COM 程序可以将 SS:SP 更改为 210A:03FE。两个 SS:SP 值将指向相同的线性地址 (2149E) 和相同的返回值,MS-DOS 在进入时压入堆栈。你现在只有 1024 字节的堆栈,就像你的 EXE 示例一样,但你的堆栈段仍然是 64k。在实模式下,段总是 64k。

现在猜猜当 SS:SP 是 210A:0000 并且您尝试将一个词压入堆栈时会发生什么? CPU 不会产生异常,它不会以某种方式拒绝执行操作,它只是做它一直做的事情。它从 SP 中减去 2,然后将字存储在新的 SS:SP 地址中。在这种情况下,这意味着 SP 将环绕到 FFFE,您推送的值将存储在 210A:FFFE 或线性地址 3109E。

现在的问题是线性地址3109E分配了什么?很可能 MS-DOS 将这 block 内存分配给您的程序,并且在那里写入值是无害的,因为您的程序没有将它用于任何事情。然而,某些 TSR 或驱动程序有可能在那里分配了内存并覆盖它会导致崩溃或其他不可预测的行为。

如果您在堆栈溢出时覆盖自己的代码实际上会更好,因为这意味着您更有可能注意到错误并修复它。

同样的回绕问题也存在于 EXE 中。如果你想要一个真正独立的堆栈,你需要将大小设为 64K,但是溢出时堆栈会覆盖自身,因此并不能从根本上消除问题。最终,作为开发人员,您有责任确保您的程序为自己分配了足够的堆栈空间,并且您的代码永远不会超过该限制。


请注意,对于 COM 文件,您需要担心一个与堆栈相关的陷阱,那就是不能保证 MS-DOS 能够为您的 COM 文件分配完整的 64K。 MS-DOS 将分配您的 COM 文件适合的最大空闲内存块。如果该内存块小于 64K,则 SP 不会设置为 FFFE,而是将 SP 设置为指向分配给程序的最后一个字。在最坏的情况下,这意味着堆栈将立即开始覆盖 COM 文件中的代码和数据。因此,最好在 COM 文件的末尾分配空间以为堆栈保留空间。

关于assembly - 为什么 .COM 程序中只有一个段,既用于程序代码又用于堆栈?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63541750/

相关文章:

assembly - 没有 32 位寄存器的 32 位/16 位有符号整数除法?

Python 的 FTPLib 太慢?

string - 组件 8086 TASM - 0Ah 21h 记住最后一个条目

assembly - 使用内联汇编启动 shell

c++ - x86下划线前缀问题 : Calling NASM function from C++ function works in x64 but fails in x86

dos - 在 DOS 中重命名导致无扩展名文件出现语法错误

c - 什么是适用于 OSX、Windows XP 或 DOS 的良好 C 编译器?

assembly - Int 21h/ah=39h 在创建目录时返回 AX=3

assembly - 如何从 Cargo 构建中获取 assembly 输出?

assembly - .text 和 .code 节名称之间的区别