c++ - 通过外部分配的数据调用 Eigen GEMM

标签 c++ eigen matrix-multiplication allocation eigen3

Eigen 具有惊人的快速 GEMM 实现,因此我想在我的宠物项目张量库中使用它。 如果我理解正确,可以通过 Eigen::Map 实现。我编写了简单的示例并定义了 EIGEN_NO_MALLOC 以确保没有不需要的分配。

它适用于像 C += A * B 这样的简单矩阵乘法。 但不幸的是,它无法处理 C += alpha * A * B(类似 GEMM)的情况。

#include <iostream>
#include <vector>

#define EIGEN_NO_MALLOC
#include "Eigen/Core"

int main()
{
    using Scalar = float;
    using namespace Eigen;
    std::vector<Scalar> aDat = {1, 2, 3, 4};
    std::vector<Scalar> bDat = {1, 2, 3, 4};
    std::vector<Scalar> cDat = {1, 2, 3, 4};
    Map<Matrix<Scalar, -1, -1, RowMajor>, Unaligned> a(aDat.data(), 2, 2);
    Map<Matrix<Scalar, -1, -1, RowMajor>, Unaligned> b(bDat.data(), 2, 2);
    Map<Matrix<Scalar, -1, -1, RowMajor>, Unaligned> c(cDat.data(), 2, 2);

    //Ok
    c.noalias() += a * b;

    //Assertion `false && "heap allocation is forbidden.....
    c.noalias() += 2 * a * b;

    return 0;
}

c.noalias() += 2 * a * b; 给我以下运行时错误

a.out: path_to_eigen/Eigen/src/Core/util/Memory.h:129: void Eigen::internal::check_that_malloc_is_allowed(): Assertion `false && "heap allocation is forbidden (EIGEN_NO_MALLOC is defined)"' failed.

是否可以在没有分配的情况下调用 c.noalias() += someScalar * a * b;

PS我的eigen版本是3.3.2gcc版本是7.2.0

抱歉我的英语不好

最佳答案

这看起来像是小型优化引入的错误。对于产品(KxM)*(MxN)其中 K+M+N < EIGEN_GEMM_TO_COEFFBASED_THRESHOLD (默认情况下为 20 ),Eigen 切换到惰性产品实现,这显然认为评估为临时产品是个好主意。您的示例实际上可以正常工作,例如对于 5x5 * 5x10产品。

我针对该问题提交了错误:http://eigen.tuxfamily.org/bz/show_bug.cgi?id=1562

如果您想快速解决问题,请定义 -D EIGEN_GEMM_TO_COEFFBASED_THRESHOLD=1 ,这将始终使用大矩阵-GEMM 实现。

另一方面,如果您在编译时知道矩阵大小,则最好使用相应的固定大小类型(在您的情况下为 Matrix<Scalar, 2, 2, RowMajor>)。

关于c++ - 通过外部分配的数据调用 Eigen GEMM,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51043842/

相关文章:

c - 自定义角度的旋转点矩阵

c++ - 获取主机名和 IPv6

c++ - 如何将文件的特定部分读入私有(private)数据成员

c++ - C++ Eigen 。需要建议

c++ - 扩展 Eigen Ref 类

c++ - 从 Vector3f 转换为 Matrix4f

python - 如何获得比 numpy.dot 更快的代码用于矩阵乘法?

matrix-multiplication - wxMaxima : matrix of matrices, 向量的向量,以及 “.” 运算符

c++ - 无法从 C++ 中的 .txt 文件加载数组

c++ - 对本地对象的 undefined reference