我一直在使用 Valgrind 进行一些测试,以了解编译器如何翻译函数,并且发现,有时,由于未内联,在不同文件上编写的函数与在同一源文件上编写的函数相比,性能较差。
考虑到我有不同的文件,每个文件都包含与特定区域相关的函数,并且所有文件共享一个声明所有函数的公共(public) header ,这是预期的吗?
为什么编译器在将它们写入不同文件时不内联它们,但在将它们写入同一页面时却内联它们?
如果此行为开始导致性能问题,建议的操作过程是什么,在编译之前手动将所有函数放在同一个文件中?
示例:
//source 1
void foo(char *str1, char *str2)
{
//here goes the code
}
//source 2
void *bar(int something, char *somethingElse)
{
//bar code
foo(variableInsideBar, anotherVariableCreatedInsideBar);
return variableInsideBar;
}
性能成本示例:
在不同文件上:29920
两者都在同一个文件上:8704
对于更大的函数,它并不那么明显,但仍然会发生。
最佳答案
如果您使用的是gcc
,您应该尝试选项-combine
和-fwhole-program
并将所有源文件传递给编译器在一次调用中。传统上不同的C文件是单独编译的,但优化交叉编译单元(文件)变得越来越普遍。
关于c - 为什么编译器内联函数不写在不同的源文件上?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19071933/