java - 大型训练数据集上的 WEKA(java 代码)

标签 java classification weka

我正在使用 WEKA 进行分类。我在 Java 代码中使用 WEKA jar 文件。我的训练数据集有 56000 个实例和 1253 个特征。我使用简单的分类算法,如逻辑回归、J48、随机森林随机树等。我只能获得随机森林的结果。在为其他分类器构建训练模型时,我的程序持续运行了 6-7 个小时,但没有得到任何结果或错误。

任何人都可以建议一种在大型数据集上训练 WEKA 分类器的更快方法吗?

谢谢!

最佳答案

由于 weka 的机器学习算法实现会将整个数据集加载到主内存中,因此有时可能需要花费大量时间来训练模型。通过命令行使用 Weka 可能会在这方面有所帮助。还有一些其他方法可以减少培训时间。他们的入伍时间为http://www.cs.waikato.ac.nz/ml/weka/bigdata.html

希望有帮助。

关于java - 大型训练数据集上的 WEKA(java 代码),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38288939/

相关文章:

machine-learning - 解释使用一对一选择输出的多类 SVM

image-processing - 在训练 Faster R-CNN 模型时 - 'epoch_length' 是什么意思?

java - Eclipse - 为现有项目设置 .classpath 文件

java - Weka 是否按顺序评估?

java - 在 Weblogic 服务器上使用 Spring Boot REST 返回数组或列表时出现内部服务器错误

java - Android NullPointerException 错误消息

java - 如何访问 Android 中 Web API 方法的返回值?

nlp - huggingface longformer内存问题

java - 尝试编写一个类,允许在线程启动之前和线程完成之后执行某些操作

java - 提取Weka中的重要属性