Eigen 具有惊人的快速 GEMM 实现,因此我想在我的宠物项目张量库中使用它。
如果我理解正确,可以通过 Eigen::Map 实现。我编写了简单的示例并定义了 EIGEN_NO_MALLOC
以确保没有不需要的分配。
它适用于像 C += A * B
这样的简单矩阵乘法。
但不幸的是,它无法处理 C += alpha * A * B
(类似 GEMM)的情况。
#include <iostream>
#include <vector>
#define EIGEN_NO_MALLOC
#include "Eigen/Core"
int main()
{
using Scalar = float;
using namespace Eigen;
std::vector<Scalar> aDat = {1, 2, 3, 4};
std::vector<Scalar> bDat = {1, 2, 3, 4};
std::vector<Scalar> cDat = {1, 2, 3, 4};
Map<Matrix<Scalar, -1, -1, RowMajor>, Unaligned> a(aDat.data(), 2, 2);
Map<Matrix<Scalar, -1, -1, RowMajor>, Unaligned> b(bDat.data(), 2, 2);
Map<Matrix<Scalar, -1, -1, RowMajor>, Unaligned> c(cDat.data(), 2, 2);
//Ok
c.noalias() += a * b;
//Assertion `false && "heap allocation is forbidden.....
c.noalias() += 2 * a * b;
return 0;
}
c.noalias() += 2 * a * b;
给我以下运行时错误
a.out: path_to_eigen/Eigen/src/Core/util/Memory.h:129: void Eigen::internal::check_that_malloc_is_allowed(): Assertion `false && "heap allocation is forbidden (EIGEN_NO_MALLOC is defined)"' failed.
是否可以在没有分配的情况下调用 c.noalias() += someScalar * a * b;
?
PS我的eigen版本是3.3.2
,gcc
版本是7.2.0
抱歉我的英语不好
最佳答案
这看起来像是小型优化引入的错误。对于产品(KxM)*(MxN)
其中 K+M+N < EIGEN_GEMM_TO_COEFFBASED_THRESHOLD
(默认情况下为 20
),Eigen 切换到惰性产品实现,这显然认为评估为临时产品是个好主意。您的示例实际上可以正常工作,例如对于 5x5 * 5x10
产品。
我针对该问题提交了错误:http://eigen.tuxfamily.org/bz/show_bug.cgi?id=1562
如果您想快速解决问题,请定义 -D EIGEN_GEMM_TO_COEFFBASED_THRESHOLD=1
,这将始终使用大矩阵-GEMM 实现。
另一方面,如果您在编译时知道矩阵大小,则最好使用相应的固定大小类型(在您的情况下为 Matrix<Scalar, 2, 2, RowMajor>
)。
关于c++ - 通过外部分配的数据调用 Eigen GEMM,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51043842/