我正在使用 WEKA 进行分类。我在 Java 代码中使用 WEKA jar 文件。我的训练数据集有 56000 个实例和 1253 个特征。我使用简单的分类算法,如逻辑回归、J48、随机森林随机树等。我只能获得随机森林的结果。在为其他分类器构建训练模型时,我的程序持续运行了 6-7 个小时,但没有得到任何结果或错误。
任何人都可以建议一种在大型数据集上训练 WEKA 分类器的更快方法吗?
谢谢!
最佳答案
由于 weka 的机器学习算法实现会将整个数据集加载到主内存中,因此有时可能需要花费大量时间来训练模型。通过命令行使用 Weka 可能会在这方面有所帮助。还有一些其他方法可以减少培训时间。他们的入伍时间为http://www.cs.waikato.ac.nz/ml/weka/bigdata.html
希望有帮助。
关于java - 大型训练数据集上的 WEKA(java 代码),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38288939/