c++ - LLVM-clang 编译器优化器以一种非常奇怪的方式重新排列代码，怎么办？

我有以下代码

renderer_opengl *oldr = (renderer_opengl*)enabler->renderer;
renderer *newr = new renderer;

void **vtable_old = ((void ***)oldr)[0];
void **vtable_new = ((void ***)newr)[0];

...

void *draw_new             = vtable_new[IDX_draw];
void *reshape_gl_new       = vtable_new[IDX_reshape_gl];
void *update_tile_new      = vtable_new[IDX_update_tile];    

// out << draw_new << std::endl;

p.verifyAccess(vtable_new, sizeof(void*)*32, true);
memcpy(vtable_new, vtable_old, sizeof(void*)*32);

out << draw_new << std::endl;

vtable_new[IDX_draw] = draw_new;
...

编译

Apple LLVM version 6.0 (clang-600.0.51) (based on LLVM 3.5svn)

我在这里做什么并不重要，但问题是编译器重新排列代码并将赋值给 draw_new after memcpy ，所以在输出流中我看到的地址来自 vtable_old 而不是 vtable_new!这发生在 -O3 甚至 -O2 上。如果我取消注释第一个输出，一切都会恢复正常。

这是什么 - 预期的行为，clang 中的错误还是我遗漏了什么？如何解决？

编辑

将 volatile 添加到 vtable_new 声明

void ** volatile vtable_new = ((void ***)newr)[0];

有帮助。 -fno-strict-aliasing 和 asm volatile (""::::"memory") 屏障没有。我仍然不明白编译器在这里做什么。

最佳答案

正如其他人所提到的，我认为编译器正在利用严格的别名规则。尝试替换:

void **vtable_old = ((void ***)oldr)[0];
void **vtable_new = ((void ***)newr)[0];

与:

void **vtable_old;
void **vtable_new;

memcpy( &vtable_old, oldr, sizeof(vtable_old));
memcpy( &vtable_new, newr, sizeof(vtable_new));

关于c++ - LLVM-clang 编译器优化器以一种非常奇怪的方式重新排列代码，怎么办？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26313588/

c++ - LLVM-clang 编译器优化器以一种非常奇怪的方式重新排列代码，怎么办？

上一篇：c++ - 查看我的 C++ 滚动菜单并提供任何提示

下一篇：c++ - parallel for each嵌套在for循环中