我关注了关于 One-byte-off pointer still valid in C? 的讨论.
据我所知,该讨论的要点是,如果您:
char *p = malloc(4);
然后可以通过使用指针运算得到指向p+4
的指针。如果您使用 p+5
获取指针,则行为未定义。
我明白为什么取消引用 p+5
会导致未定义的行为。但是仅使用指针运算的未定义行为?
为什么算术运算符 +
和 -
不是有效运算?我认为从指针中添加或减去数字没有任何危害。毕竟,指针是由捕获对象地址的数字表示的。
当然,我不在标准化委员会 :) 我不知道他们在编纂标准之前进行的讨论。我只是好奇。任何见解都会有用。
最佳答案
最简单的答案是可以想象机器会捕获整数溢出。如果是这种情况,那么任何不局限于单个存储区域的指针算法都可能导致溢出,这会导致陷阱,从而中断程序的执行。在尝试指针运算之前,C 不应强制检查可能的溢出,因此标准允许在此类机器上的 C 实现仅允许陷阱发生,即使随后发生困惑也是如此。
另一种情况是内存被分段的架构,因此指针由段地址(带有隐式尾随 0)和偏移量组成。任何给定的对象都必须适合单个段,这意味着有效的指针算法只能在偏移量上起作用。同样,在指针运算过程中溢出偏移量可能会产生随机结果,并且 C 实现没有义务对此进行检查。
最后,编译器可能会在所有指针算法都有效的假设下进行优化。作为一个简单的激励案例:
if (iter - 1 < object.end()) {...}
这里可以省略测试,因为它必须对任何指针 iter
为真,其值是 object
中(或之后)的有效位置。用于无效指针运算的 UB 意味着编译器没有任何义务尝试证明 iter
是有效的(尽管它可能需要确保它基于指向 object< 的指针
), 所以它可以放弃比较并继续生成无条件代码。一些编译器可能会做这种事情,所以要小心 :)
顺便说一句,这里是未指定
行为和未定义
行为之间的重要区别。 ==
比较两个指针(相同类型)是定义的,无论它们是否是指向同一对象的指针。特别是,如果 a
和 b
是同一类型的两个不同对象,则 end_a
是指向a
和begin_b
是指向b
的指针,那么
end_a == begin_b
未指定;当且仅当 b
恰好在内存中的 a
之后,它将是 1
,否则为 0
。由于您通常不能依赖知道(除非 a
和 b
是同一数组的数组元素),比较通常是没有意义的; 但这不是未定义的行为,编译器需要安排生成 0
或 1
(此外,为了与始终具有相同的值,因为您可以依赖不会在内存中四处移动的对象。)
关于c - 超出有效内存范围的指针运算会产生什么危害?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22465388/