python - 有什么方法可以加快Seaborns Pairplot的速度

标签 python performance parallel-processing seaborn

我有一个具有250.000行但140列的数据框,并且正在尝试构建对图。的变量。
我知道子图的数量巨大,而且绘制所需的时间也很多。 (我在配备3,4 GHZ和32 GB RAM的i5上等待了一个多小时)。

考虑到scikit learning允许并行构建随机森林,我正在检查seaborn是否也可以这样做。
但是,我什么也没找到。源代码似乎为每个图像调用了matplotlib plot函数。

这不能并行化吗?如果是,那么从这里开始的好方法是什么?

最佳答案

如果速度瓶颈确实存在,则可以并行采样,而不是并行化,可以降低DataFrame的大小,例如1000行,以快速查看。通常,只要获得1000分就可以大致了解正在发生的事情。

sns.pairplot(df.sample(1000))

关于python - 有什么方法可以加快Seaborns Pairplot的速度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37612434/

相关文章:

python - python中的线程编程

python - Jupyter 中的 Matplotlib 内联 - 如何控制绘图的显示时间?

Python:拒绝列表中的异常值(序列)

python - 使用 tweepy 访问 Twitter 的 Streaming API

r - 在 R 中迭代多个条件时如何提高性能?

performance - 保留历史记录和当前概览

javascript - 在javascript中返回属性VS属性直接访问的方法

Rmpi : mclapply: In selectChildren(ac, 1) : 选择错误 'Interrupted system call'

c - 搜索图像模式

java - 使用 ThreadPoolExecutor 时看不到 CPU Bound 任务的上下文切换开销