所以我一直在使用 VS 2010 通过 vsperfreport/vsperfcmd 命令行工具试验 vsperfmon。我构建了一个非常简单的程序来分析并尝试理解这些工具输出的数字:
void DoStuff()
{
double res = 0.0;
for (double i = 0.0; i < 10000.0; ++i)
{
res += sin(i);
}
printf("res is %lf", res);
}
int _tmain(int argc, _TCHAR* argv[])
{
DoStuff();
return 0;
}
我通过运行详细说明的步骤来分析可执行文件 here在命令行。上面的代码被编译成 perfPlay.exe,然后我执行以下步骤:
vsinstr perfPlay.exe
vsperfcmd /start:trace /output:perfPlay.vsp
perfPlay.exe
vsperfcmd /shutdown
vsperfreport perfPlay.vsp /output:singleFile /summary:All
这是我想不通的奇怪事情。在函数和调用者/被调用者报告中,DoStuff 的已用包含时间小于sin() 的包含时间: 这是 DoStuff() 的调用者/被调用者报告,注意 THUNK:sin 与 Root 函数的 Elapsed Inclusive Time
Type Function Name Elapsed Inclusive Time Elapsed Exclusive Time Root DoStuffInLib(void) 2157487 0 Caller _wmain 2157487 0 2157487 0 Callee __RTC_CheckEsp 57 57 Callee _printf 347667 347667 Callee THUNK:sin 2282622 81435
经过的包含时间定义为在您的函数中执行代码所花费的时间,包括您调用的函数。根据这个定义,DoStuff 的包容时间应该总是 > 罪恶的包容时间。上面的差异相对较小,但是如果我让这个东西运行一段时间它就会变大。这种差异在 Debug 和 Release 模式下都存在。
为什么罪的包容时间比较长呢?我希望它代表 Root 条目时间的一部分。我不太确定发生了什么,或者如果它在做看似奇怪的事情,我是否可以信任这个工具。我怀疑我只是错过了一些能让我更清楚的东西。
最佳答案
性能监视器使用探测器来收集数据。它试图从收集到的数据中减去它自己的探测器所花费的时间,但这种校正是近似的,而且它通常会在一个方向或另一个方向上始终如一地偏离。通常,您尝试探测的函数越小,测量结果就越不准确,因为收集数据所花费的时间占已用时间的百分比更高。
关于c++ - 为什么 vsperfmon 告诉我被调用函数的包含时间比根函数的包含时间长?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9322121/