cuda - BLAS 等效于 GPU 的 LAPACK 函数

标签 cuda opencl gpu lapack blas

在 LAPACK 中有这个 function用于对角化

  SUBROUTINE DSPGVX( ITYPE, JOBZ, RANGE, UPLO, N, AP, BP, VL, VU,
 $                   IL, IU, ABSTOL, M, W, Z, LDZ, WORK, IWORK,
 $                   IFAIL, INFO )

*

我正在寻找它的 GPU 实现。我试图找出这个功能是否已经在CUDA(或OpenCL)中实现,但只找到了CULA,它不是开源的。

因此,存在侧面 CUBLAS,我想知道我如何知道是否有与此子例程等效的 BLAS 或 CUBLAS。

最佳答案

BLAS 不包括特征值求解器,而 CUBLAS 在这方面也不异常(exception)。 UTK开发Magma库包括几个 GPU 加速的特征值问题例程。我不认为 xSPGV 已实现,但其他几个已实现。根据您的矩阵的特性,您可能会使用某些东西。

关于cuda - BLAS 等效于 GPU 的 LAPACK 函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9165299/

相关文章:

python - OpenCL:内核是在 CPU 还是 iGPU 上运行?

c++ - NVidia推力device_vector的字符串

algorithm - CUDA 最大缩减算法不起作用

python - 参数列表的长度 (3) 和 CL 生成的参数数量 (9) 不一致

c++ - 使用 Address Sanitizer 编译主机应用程序时可使用 OpenCL

python - 无法在 docker 容器内加载动态库 'libcudart.so.11.0'

cuda - 需要帮助诊断 cudaMemcpyToSymbol 错误

cuda - cudaEventElapsedTime() 的精度是多少?

cuda - CUDA 可以使用 SIMD 扩展吗?

c++ - NVIDIA Visual profiler 不生成时间线