c++ - 是否可以在其范围之外访问局部变量的内存?

标签 c++ memory-management local-variables dangling-pointer

我有以下代码。

#include <iostream>

int * foo()
{
    int a = 5;
    return &a;
}

int main()
{
    int* p = foo();
    std::cout << *p;
    *p = 8;
    std::cout << *p;
}


并且代码仅在没有运行时异常的情况下运行!

输出为58

怎么可能?局部变量的存储不是在函数之外不可访问的吗?

最佳答案

怎么可能?局部变量的存储不是在函数之外不可访问的吗?


您租了旅馆房间。您将一本书放在床头柜的顶部抽屉中,然后入睡。您第二天早上退房,但是“忘记了”退还您的钥匙。您偷了钥匙!

一周后,您返回酒店,不办理入住手续,用偷来的钥匙偷偷进入旧房间,然后看向抽屉。你的书还在那里。惊人!

这个怎么可能?如果您没有租房,不是不是无法进入酒店房间抽屉的内容吗?

好吧,很明显,这种情况可以在现实世界中发生,没有问题。当您不再被授权进入房间时,没有任何神秘的力量会使您的书消失。也没有一种神秘的力量阻止您使用失窃的钥匙进入房间。

不需要酒店管理人员删除您的书。您没有与他们签订合同,说如果您留下东西,他们会为您切碎。如果您用偷来的钥匙非法重新进入房间以将其取回,则无需酒店安全人员抓住您潜行。您没有与他们订立合同,说“如果我尝试潜入我的房间,房间之后,您必须阻止我。”相反,您与他们签订了一份合同,上面写着“我保证以后不会再潜入我的房间”,这是您违反的合同。

在这种情况下,任何事情都可能发生。这本书可以在那里-您很幸运。可能有人的书在那里,而您的书可能在酒店的炉子里。当您进来时,有人可能会在那里,将您的书撕成碎片。该酒店本可以删除桌子并完全预订,然后用衣柜代替。整个酒店可能会被拆毁,取而代之的是一个足球场,而当您潜行时,您将在爆炸中丧生。

您不知道会发生什么;当您退出酒店并偷走了以后非法使用的钥匙时,您放弃了生活在可预测的安全世界中的权利,因为您选择了违反系统规则。

C ++不是安全的语言。它会很乐意让您打破系统规则。如果您尝试做一些非法和愚蠢的事情,例如回到没有权限的房间,或者翻阅一张可能根本不在的桌子,那么C ++不会阻止您。比C ++更安全的语言通过限制您的力量来解决此问题-例如,通过对键进行更严格的控制。

更新

天哪,这个答案引起了很多关注。 (我不确定为什么-我认为这只是一个“有趣”的小类比,但无论如何。)

我认为用一些其他技术思想来对此进行更新可能是很紧要的。

编译器负责生成代码,该代码管理该程序处理的数据的存储。生成代码来管理内存的方法有很多,但是随着时间的流逝,两种基本技术已经根深蒂固。

第一种是具有某种“长寿”的存储区域,在该区域中,存储中每个字节的“生存期”(即与某个程序变量有效关联的时间段)无法轻易地预先预测时间。编译器生成对“堆管理器”的调用,该堆管理器知道如何在需要时动态分配存储,并在不再需要时回收它。

第二种方法是拥有一个“短暂的”存储区域,其中每个字节的生存期众所周知。在此,生命周期遵循“嵌套”模式。这些短期变量中寿命最长的变量将在任何其他短期变量之前分配,最后释放。寿命较短的变量将在寿命最长的变量之后分配,并在它们之前被释放。这些寿命较短的变量的寿命被“嵌套”在寿命较长的变量的寿命之内。

局部变量遵循后一种模式;输入方法后,其局部变量将生效。当该方法调用另一个方法时,新方法的局部变量将生效。在第一个方法的局部变量失效之前,它们将失效。可以提前确定与局部变量关联的存储生命周期的开始和结束的相对顺序。

由于这个原因,局部变量通常作为“堆栈”数据结构上的存储生成,因为堆栈具有的属性是,首先要压入的堆栈将是最后弹出的堆栈。

就像酒店决定只按顺序出租房间一样,只有在房间号高于您所选择的每个人之前,您都无法退房。

因此,让我们考虑一下堆栈。在许多操作系统中,每个线程获得一个堆栈,并且该堆栈被分配为一定的固定大小。调用方法时,东西被压入堆栈。如果您随后将指针传递回方法之外的堆栈,就像原始海报在此处所做的那样,那仅是指向某些完全有效的百万字节内存块中间的指针。打个比方,您从酒店退房;当您这样做时,您只是从编号最高的占用房间中退出。如果在您之后没有其他人入住,并且您非法返回房间,则可以保证所有物品仍在此特定酒店中。

我们将堆栈用于临时存储,因为它们确实便宜又容易。不需要使用C ++实现就可以使用堆栈来存储本地对象;它可以使用堆。事实并非如此,因为那会使程序变慢。

不需要C ++的实现就可以使您留在堆栈上的垃圾保持不变,以便以后可以非法返回它。编译器生成将刚腾出的“房间”中的所有内容都归零的代码是完全合法的。并不是因为这又会很昂贵。

不需要C ++的实现来确保在逻辑上缩小堆栈时,曾经有效的地址仍会映射到内存中。该实现被允许告诉操作系统“我们现在已经完成了该堆栈页面的使用。除非我另有说明,否则,如果有人触摸了先前有效的堆栈页面,则发出一个异常,该异常会破坏进程”。再次,实现实际上并没有这样做,因为它很慢且不必要。

取而代之的是,实现使您能够犯错误并摆脱错误。大多数时候。直到有一天,真正可怕的事情出了问题,整个过程爆炸了。

这是有问题的。有很多规则,很容易意外地打破它们。我当然有很多次。更糟糕的是,问题通常仅在损坏发生后检测到内存损坏数十亿纳秒时才浮出水面,而很难弄清楚是谁弄乱了内存。

更多的内存安全语言通过限制您的能力来解决此问题。在“普通” C#中,根本没有办法获取本地地址并将其返回或存储以供以后使用。您可以使用本地地址,但是语言设计巧妙,因此在本地生命周期结束后无法使用它。为了获取本地地址并将其传递回去,您必须将编译器置于特殊的“不安全”模式,并将“不安全”一词放入程序中,以引起注意以下事实:可能违反规则的危险。

进一步阅读:


如果C#允许返回引用怎么办?巧合的是,这是今天的博客文章的主题:

http://blogs.msdn.com/b/ericlippert/archive/2011/06/23/ref-returns-and-ref-locals.aspx
为什么我们使用堆栈来管理内存? C#中的值类型是否始终存储在堆栈中?虚拟内存如何工作?还有更多有关C#内存管理器如何工作的主题。这些文章中有许多也与C ++程序员紧密相关:

https://blogs.msdn.microsoft.com/ericlippert/tag/memory-management/

关于c++ - 是否可以在其范围之外访问局部变量的内存?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46553453/

相关文章:

c++ - 我可以同时复制一个 shared_ptr 吗?

c++ - SDR 中的射频分频器功能

c++ - 如何仅使用数学来旋转 16x16 位图数组的内容(无缩放,只需剪掉角)

memory - GDB 'Addresses' 。这些是什么?

iphone - 内存泄漏 - 应用程序退出并显示信号 9

c++ - Xcode需要哪些设置才能构建此代码

c++ - _Expand 与 new 与 GNU

c++ - 如何使用类似 Type() 的语法对 Type* 指针进行值初始化?

java - 更改 JButtons 名称并使用新名称。在方法中

java - 为什么我不能在未初始化的局部变量上放置断点?