我正在解决一个更大的问题,并且在尝试使用 OpenMP 并行化某些循环时遇到了错误。我用下面一些模仿我自己的代码的更简单的代码重现了这个问题。
问题是当我运行程序时,它会随机进入某种无限循环/死锁(CPU 是 100%,但什么都不做)。从我的测试中可以看出,其中一个线程尝试计算矩阵矩阵乘积,但由于某种原因从未完成。
我知道如果启用 OpenMP,Eigen 将使用 OpenMP 并行化矩阵-矩阵乘积。我还在这之外添加了另一个并行循环。但是,如果我通过定义 EIGEN_DONT_PARALLELIZE 禁用 Eigen 的并行化,这个错误仍然会发生。
我在带有 Eigen 3.0.4 的 MacOS 10.6.8 上使用 gcc 版本 4.6.0 20101127。
我不知道哪里出了问题......
#include <iostream>
#include <Eigen/Core>
using namespace std;
using namespace Eigen;
MatrixXd Test(MatrixXd const& F, MatrixXd const& G)
{
MatrixXd H(F.rows(), G.cols());
H.noalias() = F*G;
return H;
}
int main()
{
MatrixXd F = MatrixXd::Random(2,2);
MatrixXd G = MatrixXd::Random(2,2);
#pragma omp parallel for
for (unsigned int i = 0; i < 10000; ++i)
MatrixXd H = Test(F,G);
cout << "Done!" << endl;
}
最佳答案
经过一番调试,我认为问题出在Eigen。在文件 src/Core/products/GeneralBlockPanelKernel.h
中有一个名为 manage_caching_sizes
的函数声明了两个静态变量:
static std::ptrdiff_t m_l1CacheSize = 0;
static std::ptrdiff_t m_l2CacheSize = 0;
将其更改为:
static std::ptrdiff_t m_l1CacheSize = 0;
static std::ptrdiff_t m_l2CacheSize = 0;
#pragma omp threadprivate(m_l1CacheSize, m_l2CacheSize)
解决了我的问题。
关于c++ - 使用 OpenMP 和 Eigen 会导致无限循环/死锁,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8828466/