我有一个具有250.000行但140列的数据框,并且正在尝试构建对图。的变量。
我知道子图的数量巨大,而且绘制所需的时间也很多。 (我在配备3,4 GHZ和32 GB RAM的i5上等待了一个多小时)。
考虑到scikit learning允许并行构建随机森林,我正在检查seaborn是否也可以这样做。
但是,我什么也没找到。源代码似乎为每个图像调用了matplotlib plot函数。
这不能并行化吗?如果是,那么从这里开始的好方法是什么?
最佳答案
如果速度瓶颈确实存在,则可以并行采样,而不是并行化,可以降低DataFrame
的大小,例如1000行,以快速查看。通常,只要获得1000分就可以大致了解正在发生的事情。
即sns.pairplot(df.sample(1000))
。
关于python - 有什么方法可以加快Seaborns Pairplot的速度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37612434/