我最近试图制作一个计算 FLOPS 的简单程序。由于 c++
足够快,所以我认为值得一试以获得接近的结果。
当我用 Notepad++ 插件 NppExec
编译它时,它工作正常,但我没有构建它。当我在 CodeBlocks 中构建和运行时,它会不断迭代并且不会完成该过程。所以我回到 Notepad++ 并再次编译它,然后这次当我运行它时它工作正常,迭代只过去了一秒钟。
#include<iostream>
#include<conio.h>
#include<ctime>
#include<iomanip>
using namespace std;
int main(){
float a=1.0,b=2.0,var,j;
double flop;
clock_t start,end;
cout<<"\n Iterating...";
start=clock();
for(j=0;j<999999999;j++){ // Iterates 999999999 times
var=a*b+a/b; // <-- 5 Flops, or am I wrong?
}
end=clock();
cout<<"\n\n Calculating...";
double secs=((float)(end-start))/CLOCKS_PER_SEC;
flop=999999; // Actually is 999999999, but integer overflow in expression
flop=5*(flop*1000+999); // In the brackets I make the value to same as 999999999
// Multiply with 5 and basically get Flops here
flop/=secs; // To get the Flops in second, multiply with time elapsed
string prefix,fstr;
if(flop/1000000000>=1||flop/1000000000<1){
flop/=1000000000;
prefix="GFLOPS";
}
else if(flop/1000000000000>=1){
flop/=1000000000000;
prefix="TFLOPS";
}
cout<<"\n\n\n Floating-points Operations Per Second\n\n > "<<setprecision(3)<<flop<<" "<<prefix;
getch();
return 0;
}
如果您知道如何使结果更精确,请继续,任何答案将不胜感激!
最佳答案
这段代码有很多问题。 首先,您使用的是 float
变量 ( j
) 来维护具有严格终止条件的循环计数器 j<999999999
.这可能是循环可能永远运行的原因。 j
的类型应为整数类型,例如 int
.
其次,循环中的触发器数量取决于您使用的编译器、您传递给编译器的编译器选项以及目标架构。解决这个问题的最佳方法是查看生成的汇编代码。
第三,第一次调用clock
第二次调用 clock
由于编译器优化使结果无效,可能会重新排序。您必须通过查看汇编代码来确保它们没有被重新排序。确保这一点的方法取决于编译器。
第四,这是什么意思?
flop=999999; // Actually is 999999999, but integer overflow in expression
编译器是否告诉你 999999999
结果溢出?如果是,那么您如何在循环终止条件下使用它?究竟是什么错误?
第五,这个
if(flop/1000000000>=1||flop/1000000000<1){
应该是这样的
if(flop/1000000000>=1){
第六,整个循环可能会被编译器优化掉,因为你没有使用var
。循环之后。您应该打印 var
的值在最后,所以这不会发生。
七,表达式a*b+a/b
有一个常数值。所以实际上,相同的值被分配给 var
每次迭代。编译器可能会将其优化为单个常量赋值。在这种情况下,将发出零触发器。
第八,这里的注释应该说除而不是乘。
flop/=secs; // To get the Flops in second, multiply with time elapsed
第九,这个条件if(flop/1000000000000>=1)
应该在此条件之前出现 if(flop/1000000000>=1)
第十,在这行代码中,它被称为Floating-point
cout<<"\n\n\n Floating-points Operations Per Second\n\n
十一,这个数字999999999
应该在函数的开头定义为常量,以便更容易更改。
最后,您用来计算运行时间的方法是最简单的,并且在很多情况下都足够好。但是还有更复杂、更准确的方法。
关于C++计算GFlops,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31227418/