benchmarking - BLAS 库基准

标签 benchmarking multicore blas

是否有比较不同 BLAS(基本线性代数子程序)库的基准?我对单核和多核系统的稀疏矩阵乘法特别感兴趣?

最佳答案

BLAS 性能在很大程度上取决于系统,因此您最好在要使用的机器上自己进行基准测试。由于只有少数 BLAS 实现,所以工作量比听起来要少(通常是 hardware vendors implementationATLASGOTO BLAS )。

但请注意,BLAS 仅涵盖密集矩阵,因此对于稀疏矩阵乘法,您将需要 Sparse-BLAS 或其他一些代码。这里的性能不仅取决于硬件,还取决于您要使用的稀疏格式,甚至取决于您正在使用的矩阵类型(稀疏模式、带宽等很重要)。因此,与密集情况相比,如果您需要最高性能,则需要进行自己的基准测试。

关于benchmarking - BLAS 库基准,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/318640/

相关文章:

sql-server - 查询基准测试

python - numpy 数组赋值比 python 列表慢

android - 提高 Android OpenCV 项目的性能

c++ - 使用 LAPACK/BLAS 的可变大小数组

c - BLAS 和 LAPACK 库是否符合 MISRA 标准?

c++ - 如何使用简单的 C++ 程序测试 CPU

mysql - 如何将 mysql 限制为单个 cpu,以允许进行硬件基准测试

c - 如何使用Windows 7中的所有内核?

.net - .NET 是否利用了多核?

python - Numpy:当某些向量元素等于零时,矩阵向量乘法不会跳过计算吗?