是否有比较不同 BLAS(基本线性代数子程序)库的基准?我对单核和多核系统的稀疏矩阵乘法特别感兴趣?
最佳答案
BLAS 性能在很大程度上取决于系统,因此您最好在要使用的机器上自己进行基准测试。由于只有少数 BLAS 实现,所以工作量比听起来要少(通常是 hardware vendors implementation 、 ATLAS 和 GOTO BLAS )。
但请注意,BLAS 仅涵盖密集矩阵,因此对于稀疏矩阵乘法,您将需要 Sparse-BLAS 或其他一些代码。这里的性能不仅取决于硬件,还取决于您要使用的稀疏格式,甚至取决于您正在使用的矩阵类型(稀疏模式、带宽等很重要)。因此,与密集情况相比,如果您需要最高性能,则需要进行自己的基准测试。
关于benchmarking - BLAS 库基准,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/318640/