我想运行一个并行的 for 循环。我需要我的每个进程都可以访问 2 个大字典 gene_dict
和 transcript_dict
.这是我首先尝试的
@everywhere( function EM ... end )
generefs = [ @spawnat i genes for i in 2:nprocs()]
dict1refs = [ @spawnat i gene_dict for i in 2:nprocs()]
dict2refs = [ @spawnat i transcript_dict for i in 2:nprocs()]
result = @parallel (vcat) for i in 1:length(genes)
EM(genes[i], gene_dict, transcript_dict)
end
但我在所有进程(不仅仅是5)上都收到以下错误:
exception on 5: ERROR: genes not defined
in anonymous at no file:1514
in anonymous at multi.jl:1364
in anonymous at multi.jl:820
in run_work_thunk at multi.jl:593
in run_work_thunk at multi.jl:602
in anonymous at task.jl:6
UndefVarError(:genes)
我以为
@spawnat
会将我需要的三个数据结构移动到所有进程中。我的第一个想法是这个 Action 可能需要一段时间,并且并行 for 循环会在数据传输完成之前尝试运行。
最佳答案
数据由 @spawnat
移动但它不绑定(bind)到与主节点上名称相同的变量。相反,数据保存在相当隐藏的 Dict
中。命名为 Base.PGRP
在 worker 身上。要访问这些值,您必须 fetch
RemoteRef
s 在您的情况下将类似于
result = @parallel (vcat) for i in 1:length(genes)
EM(fetch(genes[i]), fetch(gene_dict[i]), fetch(transcript_dict[i]))
end
关于for-loop - Julia:具有大数据移动的并行 For 循环,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27659417/