假设我有一个用于固定大小酉矩阵乘法的非常快的子例程。 (该子程序可能涉及硬件加速)例如,一个名为 quantum_unmm_256(A, U, m)
的函数将 m
右乘 256 矩阵 A 和 256 x 256 酉矩阵矩阵U。
现在我想用一个大小为 256 的倍数的酉矩阵相乘,比如 1280x1280 酉矩阵。 最好使用快速子例程的快速算法是什么?
假设所有矩阵都是密集的,具有 64 或 128 位浮点复数类型。
最佳答案
关于algorithm - 具有 block 加速的快速酉矩阵乘法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43137696/