c++ - 速度比较 : add zero or check non-zero first

标签 c++ optimization

我正在优化我正在编写的程序中最耗时的循环,该循环对数组中的许多条目求和,其中许多条目将为零。在添加之前检查条目是否为零或跳过检查并添加所有条目是否更快?下面每一个的例子。这是在 C++ 中。谢谢!

double *arr, sum=0;
...
for (int i = 0; i < n; i++)
    sum += arr[i];

double *arr, sum=0;
...
for (int i = 0; i < n; i++)
    if (arr[i])
        sum += arr[i];

最佳答案

今日名言:

Premature optimization is the root of all evil
- Donald Knuth

如果您的意图是添加一个数组的所有元素,那么请编写执行此操作的代码,并让编译器的优化器处理最好的。所以选择第一种选择;你的 future 有一天你会心存感激。

如果不是绝对必要,不要进行手动优化:

对于现代 CPU,无论如何都很难想到缓存管理、缓存优化、跳转预测和其他硬件技巧的所有可能影响。编译器的优化器可以结合比我们更多的因素。

如果您真的注意到一些性能问题,那么分析您的代码,并将您的精力集中在真正重要的优化上。或者,您可以在目标平台上对代码进行基准测试,但要注意基准测试中的细微差异,这可能会影响优化器。

现在,话虽这么说,第二个选项需要对数组中的每一项进行比较指令(x86 上的 ucomisd)。因此,如果大多数项目都具有非零值,那么您通常会增加不必要的开销。对于 null 项目,您可以用两条指令交换一个简单的添加,一条比较和一条条件分支。我不确定这是否真的更快,但如果有任何好处,那很可能是非常微不足道的。因此,在最好的情况下,您可以获得非常小的 yield ,但很可能会增加一些开销。所以直觉上,坚持第一个选择,除非你的探查器告诉你有问题。

关于c++ - 速度比较 : add zero or check non-zero first,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54611552/

相关文章:

c++ - 将此作为参数使用 va_start 宏是否安全?

c++ - 模块化计算器中的错误答案

c - 如何优化邻接表上的dfs遍历?

java - 在ArrayBlockingQueue中,为什么将final成员字段复制到局部final变量中?

c++ - 如何在 rascal MPL 中使用 SDF 的 {avoid}

c++ - 实数 - 如何确定是否需要 float 或 double?

c++ - 在 C++ 中紧凑地保存霍夫曼树

mysql 随机化结果和优化

mysql - 我应该如何优化这个mysql查询?

c++ - 清除后是否释放了 std::vector 内存?