python - dask 如何从调度器向 worker 分发数据?

标签 python dask

是否有关于 dask 如何拆分数据并将数据发送给 worker 的文档?我没能在官方网站上找到它。

最佳答案

如果您对数据移动政策感兴趣,那么您可能会对这份关于数据局部性的文档感兴趣:http://distributed.readthedocs.io/en/latest/locality.html

如果您对消息协议(protocol)感兴趣,那么这篇博文可能会有所帮助:http://matthewrocklin.com/blog/work/2016/04/14/dask-distributed-optimizing-protocol

作为一个警告,像这样的政策和协议(protocol)比编程接口(interface)更短暂,所以这个答案很可能会随着时间的推移而过时。不过,这应该让您了解需要考虑的事情种类。

关于python - dask 如何从调度器向 worker 分发数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38517736/

相关文章:

python - 在模块中的测试文件之间传递 py.test fixture

python - 实例变量和函数

dask - 对于大于内存的 dask 数组,大小 =(M, N) : How to re-chunk from chunks=(1, N) 到 block =(M, 1)?

python - Groupby 并应用 pandas vs dask

sql-server - 使用 Dask 的新 to_sql 提高效率(内存/速度)或替代从 dask 数据帧获取数据到 SQL Server 表

python - Dask concatenate 导致内存错误,当 pandas concatenate 不用于相同的文件时

python - dask:并行模型中的共享内存

java - 使用python与java程序交互

Python 连接列表

python - 如何检查是否从脚本中设置了 python 调试选项