python - sklearn SVC + 稀疏数据加速

标签 python machine-learning scikit-learn data-analysis

美好的一天!

我遇到了一个大麻烦,因为 SVC 花费了太多时间。我无法标准化数据,因为它是稀疏的,并且矩阵的大小对于密集表示来说太大了。我将数据缩放了

sklearn.preprocessing.scale

但这还不够。如何加快SVC的计算速度?

最佳答案

1) 购买一台内存如此巨大的机器,以至于你可以缓存整个克矩阵。缓存大小对 LibSVM 的性能影响最大,这也是 scikit learn 使用的。

2) 使用不同的算法。 Scikit learn 已经在调用 LibSVM,这可能是最快的基于 SMO 的 SVM 实现。

关于python - sklearn SVC + 稀疏数据加速,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23470718/

相关文章:

python - 如何将 Numpy 数组值分配给其他变量

python - `pandas` 中的类似日期时间的索引

python - Django - 使用电子邮件或用户名登录不起作用

machine-learning - 神经网络或任何其他监督学习算法可以学习特殊的统计方法吗?

python - 如何将二元类 Logistic 回归与 Python 合并

python - sklearn train_test_split - ValueError : Found input variables with inconsistent numbers of samples

python - Docker - 将 Cassandra 容器与另一个容器链接

python - 如何将参数传递给 Scikit-Learn Keras 模型函数

python - 在哪里设置 n_job : estimator or GridSearchCV?

python - 处理语料库以实现 word2vec