c++ - 未定义行为真的能帮助现代编译器优化生成的代码吗？

难道现代编译器不够智能，无法生成既快速又安全的代码吗？

看下面的代码:

std::vector<int> a(100);
for (int i = 0; i < 50; i++)
    { a.at(i) = i; }
...

很明显这里不会发生越界错误，聪明的编译器可以生成下一段代码:

std::vector<int> a(100);
for (int i = 0; i < 50; i++)
    { a[i] = i; } // operator[] doesn't check for out of range
...

现在让我们检查这段代码:

std::vector<int> a(unknown_function());
for (int i = 0; i < 50; i++)
    { a.at(i) = i; }
...

可以改成这样:

std::vector<int> a(unknown_function());
size_t __loop_limit = std::min(a.size(), 50);
for (int i = 0; i < __loop_limit; i++)
    { a[i] = i; }
if (50 > a.size())
    { throw std::out_of_range("oor"); }
...

此外，我们知道 int 类型在其析构函数和赋值运算符中没有副作用。所以我们可以将代码翻译成下一个等价物:

size_t __tmp = unknown_function();
if (50 > __tmp)
    { throw std::out_of_range("oor"); }
std::vector<int> a(__tmp);
for (int i = 0; i < 50; i++)
    { a[i] = i; }
...

(我不确定 C++ 标准是否允许这种优化，因为它排除了内存分配/释放步骤，但让我们想想允许这种优化的类似 C++ 的语言。)

而且，好吧，这个优化没有下一个代码那么快:

std::vector<int> a(unknown_function());
for (int i = 0; i < 50; i++)
    { a[i] = i; }

因为还有一个额外的检查 if (50 > __tmp) 如果您确信 unknown_function 永远不会返回一个小于此值的值，那么您真的不需要它超过 50。但是在这种情况下性能提升不是很高。

请注意，我的问题与以下问题略有不同:Is undefined behavior worth it?这个问题是:性能改进的优势是否超过未定义行为的缺点。它假定未定义的行为确实有助于优化代码。我的问题是:是否有可能在没有未定义行为的语言中实现与在具有未定义行为的语言中几乎相同(也许更少)的优化级别。

我能想到的唯一可以真正帮助显着提高性能的未定义行为是手动内存管理。您永远不知道指针指向的地址是否未被释放。有人可以拥有指针的拷贝，而不是对其调用 free。您的指针仍指向相同的地址。为了避免这种未定义的行为，您要么必须使用垃圾收集器(这有其自身的缺点)，要么必须维护指向该地址的所有指针的列表，并且本地址被释放时，您必须使所有这些指针无效(并且在访问它们之前检查它们是否为 null。

为多线程环境提供定义的行为也可能会导致性能成本。

PS 我不确定定义的行为是否可以用类似 C 的语言实现，但也将其添加到标签中。

最佳答案

My question is: is it possible to achieve almost the same (maybe little less) level of optimization in a language without undefined behavior as in a language with undefined behavior.

是的，通过使用类型安全的语言。 C 和 C++ 等语言恰恰需要未定义行为的概念，因为它们不是类型安全的(这基本上意味着任何指针都可以指向任何地方和任何时间)，因此在很多情况下，编译器无法静态证明在程序的任何执行过程中都不会发生违反语言规范的情况，即使确实如此。那是因为指针分析的硬性限制。没有未定义的行为，编译器必须插入太多的动态检查，其中大部分不是真正需要的，但编译器无法弄清楚。

例如，考虑安全的 C# 代码，其中函数接受指向某种类型对象(数组)的指针。由于语言和底层虚拟机的设计方式，可以保证指针指向预期类型的对象。这是静态确保的。 C# 发出的代码在某些情况下仍然需要边界和类型动态检查，但与 C/C++ 相比，实现完全定义的行为所需的动态检查数量很少，而且通常可以负担得起。许多 C# 程序可以达到或略低于相应的 C++ 程序的性能。尽管这在很大程度上取决于编译方式。

The only case I can think of where undefined behavior can really help improve performance significantly is manual memory management.

这不是上面解释的唯一情况。

Providing defined behavior for multi-threaded environment may probably cause performance costs too.

不知道你说的是什么意思。语言指定的内存模型定义了多线程程序的行为。这些模型可以从非常宽松到非常严格(例如，参见 C++ 内存模型)。

关于c++ - 未定义行为真的能帮助现代编译器优化生成的代码吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49001802/

c++ - 未定义行为真的能帮助现代编译器优化生成的代码吗？

上一篇：c++ - Rhapsody C++ 状态图 - 事件(似乎起作用)与触发操作(似乎什么都不做)

下一篇：c++ - GTest 中的嵌套匹配器