matlab - Do 循环在 Matlab 的 Mex 函数 (Fortran) 中与 OpenMP 并行化

我在 Matlab 的 Mex 函数(用 Fortran 编写)中有一个 do 循环，它对 FEM 网格的每个元素执行一些计算。我的网格由 250k 个元素组成，因此我认为值得对其进行并行化。这是我第一次尝试使用 OpenMP 并行化此代码(我是编码初学者)。我使用reduction命令来避免fintk(dofele)=fintk(dofele)+fintele中的竞争条件。这是对的吗？我可以在 Matlab 中编译它，没有任何问题。然而，当我使用它(在 Matlab 中)时，它为 12k 元素网格生成正确的结果，并且比序列化的结果更快，但是当我尝试将它用于 250k 元素网格时，Matlab 崩溃了。谢谢你帮助我

  subroutine loop_over_elements( &
  ! OUT  
  fintk,Sxyz,&
  ! IN                    
  Elem,Bemesh,Dofelemat,u,dt,NE,NDOF)

  use omp_lib
  
  implicit none
  
  mwSize NE, NDOF, ele
  integer,  parameter   :: dp = selected_real_kind(15,307)
  real(dp) :: fintk(NDOF), Sxyz(6,NE), Elemat(4,NE), Bemesh(6,12,NE), Dofelemat(12,NE)
  real(dp) :: u(NDOF)  
  
  real(dp) :: Bele(6,12), fintele(12), uele(12), si(6), dt
  integer*4  :: nodes(4), dofele(12) 
  
  fintk = 0.D0
  
  !$OMP PARALLEL DO REDUCTION(+:fintk(:)) PRIVATE(ele,nodes,Bele,dofele,uele,si,fintele) 
      DO ele = 1, NE 
        nodes   = Elemat(1:4,ele)
        Bele    = Bemesh(1:6,1:12,ele)
        dofele  = Dofelemat(1:12,ele)
        uele    = u(dofele)
        
        call comput_subroutine( &
!       IN
        Bele,uele,dt, &
!       OUT                                        
        si) 
        
        Sxyz(:,ele)   = si
        fintele       = MATMUL(TRANSPOSE(Bele),si)
        fintk(dofele) = fintk(dofele) + fintele
        
      END DO

  !$OMP END PARALLEL DO

  return
  end

最佳答案

我通过在调用 loop_over_elements 子例程之前在通用 mexFunction 子例程中添加此行解决了我遇到的 Matlab“崩溃”问题: 调用 KMP_SET_STACKSIZE(100000000)。我想，既然当我使用带有非并行子程序的大型模型时，Matlab 没有崩溃，也许这是一个内存问题。之后，我在使用带有大型数组的 OpenMp 时发现了众所周知的(不幸的是，对我来说不是)段错误问题(例如参见 this )。我仍然对设置 OMP_STACKSIZE(我不知道如何在 Mex 函数中执行此操作)和 KMP_SET_STACKSIZE 之间的区别感到困惑，但现在并行代码可以工作与大模型。

关于matlab - Do 循环在 Matlab 的 Mex 函数 (Fortran) 中与 OpenMP 并行化，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/68168880/

matlab - Do 循环在 Matlab 的 Mex 函数 (Fortran) 中与 OpenMP 并行化

上一篇：visual-studio-code - 扩展主机意外终止(与代码)Mac

下一篇：whitespace - pyparsing:匹配同一行上的单词