python - 有什么方法可以加快Seaborns Pairplot的速度

标签 python performance parallel-processing seaborn

我有一个具有250.000行但140列的数据框，并且正在尝试构建对图。的变量。
我知道子图的数量巨大，而且绘制所需的时间也很多。 (我在配备3,4 GHZ和32 GB RAM的i5上等待了一个多小时)。

考虑到scikit learning允许并行构建随机森林，我正在检查seaborn是否也可以这样做。
但是，我什么也没找到。源代码似乎为每个图像调用了matplotlib plot函数。

这不能并行化吗？如果是，那么从这里开始的好方法是什么？

最佳答案

如果速度瓶颈确实存在，则可以并行采样，而不是并行化，可以降低DataFrame的大小，例如1000行，以快速查看。通常，只要获得1000分就可以大致了解正在发生的事情。

即sns.pairplot(df.sample(1000))。

关于python - 有什么方法可以加快Seaborns Pairplot的速度，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37612434/