python - libsvm 中的大量训练和测试数据

标签 python c++ svm libsvm

我在 5x2 交叉验证中使用 Libsvm 对大量数据进行分类,也就是说,我有 47k 个样本用于训练,47k 个样本用于 10 种不同配置的测试。

我一般都是用Libsvm的脚本easy.py来对数据进行分类,但是时间太长了,我已经等了3个多小时没有结果,我还是要重复此过程 9 次以上!

有人知道如何在处理大量数据时更快地使用 libsvm 吗? C++ Libsvm 函数是否比 python 函数运行得更快?

最佳答案

LibSVM 的训练算法无法扩展到此类数据集;在最坏的情况下需要 O(n³) 的时间,在典型的情况下需要大约 O(n²) 的时间。首先要尝试的是正确缩放数据集;如果还是不行,切换到

关于python - libsvm 中的大量训练和测试数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17457460/

相关文章:

python - Matplotlib 的概率密度直方图没有意义

python - 计算非空值 Pandas

python - 在磁盘数据库和快速内存数据库之间来回移动?

c++ - glutWarpPointer 崩溃

c++ - 将十六进制字符串转换为cpp中的字符数组

python - 来自 sklearn 的决策边界

python-3.x - 运行经过训练的机器学习模型时出现错误

python - 如何找出使用ffmpeg和python提取音轨的文件扩展名?

c++ - 如果仍然可以间接执行(通过回调函数),将 C 函数声明为静态函数是不好的做法吗?

c++ - OpenCV 无法设置 SVM 参数