c++ - GCC 与 Clang 中的 Stack Smashing(可能是由于金丝雀)

标签 c++ gcc clang

我试图了解 GCC 中 “stack smashing” 错误的可能来源,但不是 Clang。

具体来说,当我只用调试符号编译一段代码时

set(CMAKE_CXX_FLAGS_DEBUG "-g")

并使用 GCC C++ 编译器 (GNU 5.4.0),应用程序崩溃

*** stack smashing detected ***: ./testprogram terminated
Aborted (core dumped)

但是,当我使用 Clang 3.8.0 时,程序可以正常完成。

我的第一个想法是,也许 GCC 的金丝雀正在捕捉缓冲区溢出,而 Clang 却没有。所以我添加了额外的调试标志

set(CMAKE_CXX_FLAGS_DEBUG "-g -fstack-protector-all")

但是 Clang 仍然编译了一个运行没有错误的程序。对我来说,这表明问题可能不是缓冲区溢出(正如您通常看到的堆栈粉碎错误),而是分配问题。

无论如何,当我添加 ASAN 标志时:

set(CMAKE_CXX_FLAGS_DEBUG "-g -fsanitize=address")

两个编译器都产生了一个程序,该程序崩溃并出现相同的错误。具体来说,

海湾合作委员会 5.4.0:

==1143==ERROR: AddressSanitizer failed to allocate 0xdfff0001000 (15392894357504) bytes at address 2008fff7000 (errno: 12)
==1143==ReserveShadowMemoryRange failed while trying to map 0xdfff0001000 bytes. Perhaps you're using ulimit -v
Aborted (core dumped)

clang 3.8.0:

==1387==ERROR: AddressSanitizer failed to allocate 0xdfff0001000 (15392894357504) bytes at address 2008fff7000 (errno: 12)
==1387==ReserveShadowMemoryRange failed while trying to map 0xdfff0001000 bytes. Perhaps you're using ulimit -v
Aborted (core dumped)

有人可以给我一些关于此错误的可能来源的提示吗?我很难追踪发生这种情况的行,因为它在一个非常大的代码库中。


编辑

问题未解决,但与以下功能隔离:

void get_sparsity(Data & data) {
    T x[n_vars] = {};
    T g[n_constraints] = {}; 
    for (Index j = 0; j < n_vars; j++) {

        const T x_j = x[j];
        x[j] = NAN;
        eval_g(n_vars, x, TRUE, n_constraints, g, &data);
        x[j] = x_j;

        std::vector<Index> nonzero_entries;
        for (Index i = 0; i < n_constraints; i++) {
            if (isnan(g[i])) {
                data.flattened_nonzero_rows.push_back(i);
                data.flattened_nonzero_cols.push_back(j);
                nonzero_entries.push_back(i);
            }
        }
        data.nonzeros.push_back(nonzero_entries);
    }
    int internal_debug_point = 5;
}

这样调用:

get_sparsity(data);
int external_debug_point= 6;

但是,当我将调试点放在 get_sparsity 函数的最后一行 internal_debug_point = 5 时,它毫无问题地到达了那一行。但是,当退出该函数时,在它到达外部调试点 external_debug_point = 6 之前,它会因错误而崩溃

received signal SIGABRT, Aborted.
0x00007ffffe315428 in __GI_raise (sig=sig@entry=6) at ../sysdeps/unix/sysv/linux/raise.c:54

我的猜测是 GCC 仅在退出该函数时检查金丝雀,因此错误实际上发生在函数内部。这听起来合理吗?如果是这样,那么有没有办法让 GCC 或 clang 进行更频繁的金丝雀检查?

最佳答案

我怀疑 ASan 内存不足。

我不认为 ASan 错误意味着您的程序正在尝试分配该内存,这意味着 ASan 正在尝试为自己分配它(它说“影子内存”,这是 ASan 用来跟踪您的内存的东西程序分配)。

如果迭代次数(和数组大小)n_vars 很大,那么该函数将在每个循环中为新的 std::vector 使用额外的内存,迫使 ASan 跟踪越来越多的内存。

您可以尝试将局部 vector 移出循环(无论如何这可能会提高函数的性能):

std::vector<Index> nonzero_entries;
for (Index j = 0; j < n_vars; j++) {

    // ...

    for (Index i = 0; i < n_constraints; i++) {
        if (isnan(g[i])) {
            data.flattened_nonzero_rows.push_back(i);
            data.flattened_nonzero_cols.push_back(j);
            nonzero_entries.push_back(i);
        }
    }
    data.nonzeros.push_back(nonzero_entries);
    nonzero_entries.clear();
}

这将为 nonzero_entries 重用相同的内存,而不是每次迭代都为新 vector 分配和释放内存。

关于c++ - GCC 与 Clang 中的 Stack Smashing(可能是由于金丝雀),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49128025/

相关文章:

c - 如何使用静态库 libdl.a 编译程序

c++ - Mac 上的 OpenMP 不再工作

c++ - 在 Windows 中编译 Clang 插件

ubuntu - 对于使用 block 的 clang 程序,您需要链接哪些库

当我们使用继承类时,c++ 捕获异常

c++ - 是代码块 10.05。与 QtWorkbench 兼容?

c++ - 对于巨大的稀疏对称矩阵,哪个是 Spectra 库中最快的特征值求解器?

c++ - 如何在 Windows 上用 C++ 以指定速率发送 UDP 数据包?

C函数看不到全局变量

c - 不同 gcc 版本的语法错误?