我有一个 GroupedDataFrame
在 Julia 1.4 (DataFrames 0.22.1) 中。我想遍历行组以计算一些统计信息。因为组多,计算速度慢,所以想做这个多线程。
编码
grouped_rows = groupby(data, by_index)
for group in grouped_rows
# do something with `group`
end
有效,但是grouped_rows = groupby(data, by_index)
Threads.@threads for group in grouped_rows
# do something with `group`
end
结果 MethodError: no method matching firstindex(::GroupedDataFrame{DataFrame})
.有没有办法并行化 DataFrame 行组上的迭代?
最佳答案
您需要有一个 AbstractVector
为 Threads.@threads
上类。
因此,请收集您的 grouped_rows
Threads.@threads for group in collect(SubDataFrame, grouped_rows)
# do something with `group`
end
关于multithreading - Julia GroupedDataFrame 组上的多线程迭代,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67381968/