就效率而言,Strassen 算法应该停止递归并应用乘法的最佳交叉点是多少?
我知道这与具体的实现和硬件密切相关,但对于一般情况应该有某种指南或某人的一些实验结果。
在网上搜索了一下,问了一些他们认为是的人
n = 64;
或
n = 32;
任何人都可以验证/拒绝这些结果吗?
最佳答案
这应该在每台机器的基础上进行调整(有点像 ATLAS 所做的)。这种优化对于相当大的矩阵是有返回的:如果你自己编写代码,并将其与 eg 进行比较。一个供应商 BLAS 实现,那么你会发现一个相当大的 n。
Strassen 算法的内存要求也需要权衡。
关于algorithm - 交叉点 : Strassen's Algorithm,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5436012/