我正在研究应该实时运行的流体动力学 Navier-Stokes 求解器。因此,性能很重要。
现在,我正在查看许多紧密循环,每个循环都占执行时间的很大一部分:没有单一的瓶颈。这些循环中的大多数执行一些浮点运算,但中间有很多分支。
浮点运算主要限于加法、减法、乘法、除法和比较。所有这些都是使用 32 位浮点数完成的。我的目标平台是 x86,至少有 SSE1 指令。 (我已经在汇编器输出中验证了编译器确实生成了 SSE 指令。)
我使用的大多数浮点值都有一个相当小的上限,接近零值的精度并不是很重要。所以我想到了:也许切换到定点算法可以加快速度?我知道唯一确定的方法就是衡量它,这可能需要几天时间,所以我想事先知道成功的几率。
定点在 Doom 时代风靡一时,但我不确定它在 2010 年的位置。考虑到现在有多少硅用于浮点性能,定点算法是否有可能仍然存在给我一个显着的速度提升?有没有人有任何可能适用于我的情况的实际经验?
最佳答案
正如其他人所说,如果您已经在使用浮点 SIMD,我怀疑您是否会使用定点获得很大的改进。
您说编译器正在发出 SSE 指令,但听起来您并没有尝试编写矢量化的 SSE 代码。我不知道编译器通常在这方面有多好,但这是需要调查的。
另外两个需要关注的领域是:
正如其他人所提到的,个人资料,个人资料,个人资料。然后让我们知道什么仍然很慢:)
PS - 在您的其他帖子之一 here ,我说服您在矩阵求解器中使用 SOR 而不是 Gauss-Seidel。现在我考虑一下,您是否有理由不使用三对角求解器?
关于performance - 定点算术值得我费心吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2667397/