在 LAPACK 中有这个 function用于对角化
SUBROUTINE DSPGVX( ITYPE, JOBZ, RANGE, UPLO, N, AP, BP, VL, VU,
$ IL, IU, ABSTOL, M, W, Z, LDZ, WORK, IWORK,
$ IFAIL, INFO )
*
我正在寻找它的 GPU 实现。我试图找出这个功能是否已经在CUDA(或OpenCL)中实现,但只找到了CULA,它不是开源的。
因此,存在侧面 CUBLAS,我想知道我如何知道是否有与此子例程等效的 BLAS 或 CUBLAS。
最佳答案
BLAS 不包括特征值求解器,而 CUBLAS 在这方面也不异常(exception)。 UTK开发Magma库包括几个 GPU 加速的特征值问题例程。我不认为 xSPGV 已实现,但其他几个已实现。根据您的矩阵的特性,您可能会使用某些东西。
关于cuda - BLAS 等效于 GPU 的 LAPACK 函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9165299/