我在映射文件消耗类中有一个成员函数,如下所示:
std::string Data::GetASCIIZ(OFFSET* offsetp) const
{
char* str = (char*)_buffer + *offsetp; // _buffer points to mmap'd file
*offsetp += strlen(str) + 1;
return std::string(str);
}
('OFFSET'的类型为unsigned long long)
其存在的理由是 (a) 返回一个以 null 结尾的 C 字符串的 std::string,该字符串被假定存在于偏移量 *offsetp
处,然后 (b) 将 *offsetp
的值推进到所述 C 字符串的末尾。
我在很多情况下都调用这个函数,没有任何问题。然而,我最近添加了一个新的调用,它总是以一种特殊的方式发出 SIGABRT:
*** glibc detected *** /home/ryan/src/coolapp/out/coolapp: free(): invalid pointer: 0xb7eb165c ***
上面的消息后面是一个回溯(最终是 libc.so.6 中的一些代码)和一个内存映射......在调试这个问题时,这两者表面上对我来说都是有用的。
通过使用 GDB 进行调试,我了解到 SIGABRT 实际上并不发生在上面引用的 Data::GetASCIIZ
方法内,而是发生在赋值右侧期间调用它的代码内。 (所以,我假设在调用 std::string 的复制构造函数期间):
[编辑:更新为与@WhozCraig的预期答案相吻合]
struct stuff
{
char version;
std::string sigstring;
// ...
};
stuff* mystuff = (stuff*)malloc(sizeof(stuff));
// ...
mystuff->sigstring = _data->GetASCIIZ(offsetp); // SIGABRT HAPPENS AT THIS SCOPE
在这种特殊情况下,偏移量 *offsetp
处的 C 字符串恰好是一个空字符串,但我已经通过临时修改 *offsetp
以指向 GDB 中的其他内容来验证这不是必然结果。
我的方法被标记为const
,因为它不会修改Data
对象的任何内部状态。我正在返回一个存在于堆栈中的对象,但我不是通过引用来执行此操作,并且我希望复制构造函数(在调用代码中)在该堆栈项被破坏之前执行正确的操作。
我尝试重写 GetASCIIZ
方法以使用显式本地,但这没有帮助。
我错过了什么吗?
如果它有用,这里是发生此 SIGABRT 的 call-during-assignment 的反汇编。 (“==>”位于错误处。)
424 sigstring = _data->GetASCIIZ(offsetp);
0x0807def1 <+183>: mov 0x8(%ebp),%eax
0x0807def4 <+186>: mov 0x4(%eax),%eax
0x0807def7 <+189>: lea 0x4(%eax),%ecx
0x0807defa <+192>: lea -0x18(%ebp),%eax
0x0807defd <+195>: mov 0x1c(%ebp),%edx
0x0807df00 <+198>: mov %edx,0x8(%esp)
0x0807df04 <+202>: mov %ecx,0x4(%esp)
0x0807df08 <+206>: mov %eax,(%esp)
0x0807df0b <+209>: call 0x809e6ee <Data::GetASCIIZ(unsigned long long*) const>
0x0807df10 <+214>: sub $0x4,%esp
0x0807df13 <+217>: mov -0x14(%ebp),%eax
0x0807df16 <+220>: lea 0x4(%eax),%edx
0x0807df19 <+223>: lea -0x18(%ebp),%eax
0x0807df1c <+226>: mov %eax,0x4(%esp)
0x0807df20 <+230>: mov %edx,(%esp)
0x0807df23 <+233>: call 0x8049560 <_ZNSsaSEOSs@plt>
0x0807df28 <+238>: lea -0x18(%ebp),%eax
0x0807df2b <+241>: mov %eax,(%esp)
=> 0x0807df2e <+244>: call 0x80497f0 <_ZNSsD1Ev@plt>
0x0807e026 <+492>: lea -0x18(%ebp),%eax
0x0807e029 <+495>: mov %eax,(%esp)
0x0807e02c <+498>: call 0x80497f0 <_ZNSsD1Ev@plt>
0x0807e031 <+503>: mov %ebx,%eax
0x0807e033 <+505>: jmp 0x807e046 <CoolClass::SpiffyMethod(unsigned long long, unsigned long long, unsigned long long*)+524>
0x0807e035 <+507>: mov %eax,%ebx
最佳答案
您的示例如下。
std::string Data::GetASCIIZ(OFFSET* offsetp) const
{
char* str = (char*)_buffer + *offsetp; // _buffer points to mmap'd file
*offsetp += strlen(str) + 1;
return std::string(str);
}
return 语句不应该返回一个新 STL 字符串吗?
std::string Data::GetASCIIZ(OFFSET* offsetp) const
{
char* str = (char*)_buffer + *offsetp; // _buffer points to mmap'd file
*offsetp += strlen(str) + 1;
return new std::string(str);
}
关于c++ - 返回 std::string 时指针无效(libc 如此说),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28008333/