c++ - 如何在 C++ 中编写指令缓存友好的程序?

标签 c++ caching c++11 c++14 cachegrind

最近 Herb Sutter 在 "Modern C++: What You Need to Know" 上做了一场精彩的演讲.本次演讲的主题是效率以及数据局部性和访问内存的重要性。 他还解释了 CPU 将如何喜欢内存(数组/vector )的线性访问。他从另一部经典引用文献中举了一个例子"Game performance by Bob Nystrom"关于这个话题。

阅读这些文章后,我了解到影响程序性能的缓存有两种类型:

  1. 数据缓存
  2. 指令缓存

Cachegrind该工具还测量我们程序的缓存类型检测信息。许多文章/博客已经解释了第一点以及如何实现良好的数据缓存效率(数据局部性)。

但是我没有得到太多关于主题指令缓存的信息,以及在我们的程序中我们应该注意什么样的事情来获得更好的性能?。根据我的理解,我们(程序员)对执行哪条指令或执行什么顺序没有太多控制。

如果小型 c++ 程序能够解释这个计数器(即指令缓存)如何随着我们编写程序的风格而变化,那就太好了。在这一点上,程序员应该遵循哪些最佳实践来获得更好的性能?

我的意思是我们可以理解数据缓存主题,如果我们的程序以类似的方式( vector 与列表)可以解释第二点。这个问题的主要目的是尽可能地理解这个话题。

最佳答案

任何改变执行流程的代码都会影响指令缓存。这包括函数调用和循环以及取消引用函数指针。

当执行分支或跳转指令时,处理器必须花费额外的时间来决定代码是否已经在指令缓存中,或者是否需要重新加载指令缓存(从分支的目的地)。

例如,某些处理器可能有足够大的指令缓存来保存小循环的执行代码。一些处理器没有大的指令缓存并简单地重新加载它。指令高速缓存的重新加载需要花费执行指令的时间。

搜索这些主题:

  • 循环展开
  • 条件指令执行(适用于 ARM 处理器)
  • 内联函数
  • 指令管道

编辑 1:提高性能的编程技术
要提高性能并减少指令缓存重新加载,请执行以下操作:

减少“if”语句 设计您的代码以最小化“if”语句。这可能包括 bool 代数,使用更多的数学或简化比较(它们真的需要吗?)。最好减少“then”和“else”子句的内容,以便编译器可以使用条件汇编语言指令。

将小函数定义为内联或宏
调用函数会产生开销,例如存储返回位置和重新加载指令缓存。对于具有少量语句的函数,请尝试向编译器建议将它们内联。内联意味着将代码的内容粘贴到执行所在的位置,而不是进行函数调用。由于避免了函数调用,因此需要重新加载指令缓存。

展开循环
对于小迭代,不要循环,而是重复循环的内容(一些编译器可能会在更高的优化级别设置下这样做)。重复的内容越多,循环顶部的分支数量就越少,重新加载指令缓存的需要就越少。

使用表查找,而不是“if”语句
一些程序使用“if-else-if”梯形图将数据映射到值。每个“if”语句都是指令缓存中执行的中断。有时,通过一些数学运算,可以将值放在一个像数组一样的表格中,并以数学方式计算索引。一旦知道索引,处理器就可以在不中断指令缓存的情况下检索数据。

更改数据或数据结构
如果数据的类型是恒定的,则可以围绕数据优化程序。例如,处理消息数据包的程序可以基于数据包 ID(想想函数指针数组)进行操作。功能将针对数据包处理进行优化。

将链表更改为数组或其他随机访问容器。可以使用数学而不是中断执行来访问数组的元素。必须遍历(循环)链表才能找到项目。

关于c++ - 如何在 C++ 中编写指令缓存友好的程序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22921373/

相关文章:

c++ - 在C++中将IPv6转换为IPv4格式?

c++ - 在简单的 C++ 游戏中遇到问题

php - 一个上传目录中包含 5000 个图像文件的网站会降低加载时​​间吗?

c++ - 如果我们知道父子之间的联系,如何递归地将元素插入 n 数组树结构?

c++ - 尝试从元组中删除最后一个类型失败

c++ - 为什么这说没有来自 "nullptr_t to const"的已知转换?

C++, boost : which is fastest way to parse string like tcp://adr:port/into address string and one int for port?

sql-server - 我可以清理某些指定数据库的缓冲区而不是整个 sql server

c++ - 如何分配内存块并将其放入Cache?

c++ - 为什么在 C++11 中不删除具有副作用未定义行为的析构函数的对象?