python - 是否可以在 sklearn 中组合多个部分拟合估计量？

标签 python machine-learning scikit-learn distributed-computing model-fitting

我有很多数据，我想通过拆分我的数据并拟合在多线程或多台机器上运行的多个估计器来并行化估计器拟合。

一些估计器为核外学习提供了 partial_fit API(例如 PassiveAggressiveClassifier here )

是否可以让多个估计器部分拟合，然后将它们各自的拟合组合成一个估计器？

最佳答案

不使用标准 API。您可以对 coef_ 和 intercept_ 进行平均，这将产生一个有意义的估计量。你想在一个核心上还是在网络上并行化？您可能有更有效的选择，其中大部分都需要多做一些工作。有 SGD 的并行实现，但这些可能只会为庞大的数据集付出代价。您的数据有多大(样本数、特征数、稀疏度)？

关于python - 是否可以在 sklearn 中组合多个部分拟合估计量？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29546209/

上一篇：python - 无法在 sklearn 中找到 Birch 模块

下一篇：python - Pandas 读取没有标题的 csv(可能在那里)

相关文章：

python - 平衡数据后 KNN 找不到类

opencv - 图像未使用 DBSCAN 正确分割

python - Python 中的对象类型转换(设计建议)

python - 抓取雅虎盈利日历

python - Plotly:如何在组合图表中注释图形对象条形图？

python-3.x - 'Shuffle' 被认为是 model_selection.train_test_split 的无效参数

python - 是否可以制作一个上下文敏感的 python 上下文管理器来保存、修改和恢复状态？

machine-learning - 卷积神经网络的正确架构是什么？

machine-learning - "ValueError: When feeding symbolic tensors to a model, we expect the tensors to have a static batch size"是什么意思？

python - 使用 Sklearn 计算 ROC 曲线下的面积？