c++ - 返回 std::string 时指针无效(libc 如此说)

标签 c++ linux stdstring g++4.8

我在映射文件消耗类中有一个成员函数,如下所示:

std::string Data::GetASCIIZ(OFFSET* offsetp) const
{
  char* str = (char*)_buffer + *offsetp;  // _buffer points to mmap'd file
  *offsetp += strlen(str) + 1;
  return std::string(str);
}

('OFFSET'的类型为unsigned long long)

其存在的理由是 (a) 返回一个以 null 结尾的 C 字符串的 std::string,该字符串被假定存在于偏移量 *offsetp 处,然后 (b) 将 *offsetp 的值推进到所述 C 字符串的末尾。

我在很多情况下都调用这个函数,没有任何问题。然而,我最近添加了一个新的调用,它总是以一种特殊的方式发出 SIGABRT:

*** glibc detected *** /home/ryan/src/coolapp/out/coolapp: free(): invalid pointer: 0xb7eb165c ***

上面的消息后面是一个回溯(最终是 libc.so.6 中的一些代码)和一个内存映射......在调试这个问题时,这两者表面上对我来说都是有用的。

通过使用 GDB 进行调试,我了解到 SIGABRT 实际上并不发生在上面引用的 Data::GetASCIIZ 方法内,而是发生在赋值右侧期间调用它的代码内。 (所以,我假设在调用 std::string 的复制构造函数期间):

[编辑:更新为与@WhozCraig的预期答案相吻合]

struct stuff
{
  char version;
  std::string sigstring;
  // ...
};

stuff* mystuff = (stuff*)malloc(sizeof(stuff));
// ...
mystuff->sigstring = _data->GetASCIIZ(offsetp);  // SIGABRT HAPPENS AT THIS SCOPE

在这种特殊情况下,偏移量 *offsetp 处的 C 字符串恰好是一个空字符串,但我已经通过临时修改 *offsetp 以指向 GDB 中的其他内容来验证这不是必然结果。

我的方法被标记为const,因为它不会修改Data对象的任何内部状态。我正在返回一个存在于堆栈中的对象,但我不是通过引用来执行此操作,并且我希望复制构造函数(在调用代码中)在该堆栈项被破坏之前执行正确的操作。

我尝试重写 GetASCIIZ 方法以使用显式本地,但这没有帮助。

我错过了什么吗?

如果它有用,这里是发生此 SIGABRT 的 call-during-assignment 的反汇编。 (“==>”位于错误处。)

424         sigstring = _data->GetASCIIZ(offsetp);
   0x0807def1 <+183>:   mov    0x8(%ebp),%eax
   0x0807def4 <+186>:   mov    0x4(%eax),%eax
   0x0807def7 <+189>:   lea    0x4(%eax),%ecx
   0x0807defa <+192>:   lea    -0x18(%ebp),%eax
   0x0807defd <+195>:   mov    0x1c(%ebp),%edx
   0x0807df00 <+198>:   mov    %edx,0x8(%esp)
   0x0807df04 <+202>:   mov    %ecx,0x4(%esp)
   0x0807df08 <+206>:   mov    %eax,(%esp)
   0x0807df0b <+209>:   call   0x809e6ee <Data::GetASCIIZ(unsigned long long*) const>
   0x0807df10 <+214>:   sub    $0x4,%esp
   0x0807df13 <+217>:   mov    -0x14(%ebp),%eax
   0x0807df16 <+220>:   lea    0x4(%eax),%edx
   0x0807df19 <+223>:   lea    -0x18(%ebp),%eax
   0x0807df1c <+226>:   mov    %eax,0x4(%esp)
   0x0807df20 <+230>:   mov    %edx,(%esp)
   0x0807df23 <+233>:   call   0x8049560 <_ZNSsaSEOSs@plt>
   0x0807df28 <+238>:   lea    -0x18(%ebp),%eax
   0x0807df2b <+241>:   mov    %eax,(%esp)
=> 0x0807df2e <+244>:   call   0x80497f0 <_ZNSsD1Ev@plt>
   0x0807e026 <+492>:   lea    -0x18(%ebp),%eax
   0x0807e029 <+495>:   mov    %eax,(%esp)
   0x0807e02c <+498>:   call   0x80497f0 <_ZNSsD1Ev@plt>
   0x0807e031 <+503>:   mov    %ebx,%eax
   0x0807e033 <+505>:   jmp    0x807e046 <CoolClass::SpiffyMethod(unsigned long long, unsigned long long, unsigned long long*)+524>
   0x0807e035 <+507>:   mov    %eax,%ebx

最佳答案

您的示例如下。

std::string Data::GetASCIIZ(OFFSET* offsetp) const
{
  char* str = (char*)_buffer + *offsetp;  // _buffer points to mmap'd file
  *offsetp += strlen(str) + 1;
  return std::string(str);
}

return 语句不应该返回一个 STL 字符串吗?

std::string Data::GetASCIIZ(OFFSET* offsetp) const
{
  char* str = (char*)_buffer + *offsetp;  // _buffer points to mmap'd file
  *offsetp += strlen(str) + 1;
  return new std::string(str);
}

关于c++ - 返回 std::string 时指针无效(libc 如此说),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28008333/

相关文章:

c++ - 重新启动 linux 守护进程

c++ - 尽管文件存在,但已编译的 C++ 程序在另一个系统上引发 "cannot open shared object file"

c++ - 这个 std::string 指针如何变成数组?

c++ - 为什么 b[2] 为假?

c++ - 将参数从主线程传递到线程。当线程退出时,主线程重置为0。为什么?

linux - 无法在 Linux 上安装 Compiz

c++ - 大多数顺序值指向同一对象的查找表?

c++ - 如何将 C++ 字符串中的单词大写?

c++ - 如何防止其他人在堆栈上创建您的类的新实例?

C++ static , extern 与全局数据一起使用