我已成功将 LibSVM API 集成到 mu java 代码中。我需要将大型文档集合转换为数字表示并将其提供给 LibSVM 分类器。据我所知weka有能力将文档传输到特征向量。任何人都可以告诉我该怎么做吗?
最佳答案
你可以这样做
DataSource source = new DataSource(new File("mycsvinputfile"));
System.out.println(source.getStructure());
Instances data = source.getDataSet();
// setting class attribute if the data format does not provide this information
// For example, the XRFF format saves the class attribute information as well
if (data.classIndex() == -1)
data.setClassIndex(data.numAttributes() - 1);
//initialize svm classifier
LibSVM svm = new LibSVM();
svm.buildClassifier(data);
不要忘记在项目中使用 weka.jar、libsvm.jar 和 wlsvm.jar(libsvm 包装器)。因此,只需将所有 3 个 jar 包含在您的构建路径或类路径或其他路径中即可。
关于java - 如何在java代码中结合weka和LibSVM,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26657339/