java - 使用java在arff文件中定义属性

标签 java csv weka

我在weka中使用j48方法。我的示例训练数据 .arff 文件如下,

 @relation l4_tbl_final

    @attribute MouseVariance numeric
    @attribute EyeValue numeric
    @attribute SocialTime numeric
    @attribute KeyWords numeric
    @attribute InvolvedTime numeric
    @attribute grade {B,A,C}

    @data
    2731.35,87,47.55,0,49.7,B
    864.891,55,0,0,94.33,B
    2495.8,1386,0,2,71.75,A
    1104.04,4490,0,0,61.91,B

前 5 个值是参数,根据等级“A”、“B”、“C”给出。

现在我需要提供测试数据集并预测这些数据的等级。为此,我应该提供 testdata.arff 文件,如下(?分数)

@attribute MouseVariance numeric
@attribute EyeValue numeric
@attribute SocialTime numeric
@attribute KeyWords numeric
@attribute InvolvedTime numeric
@attribute grade {B,A,C}

@data
2731.35,87,47.55,0,49.7,?
864.891,55,0,0,94.33,?
2495.8,1386,0,2,71.75,?
1104.04,4490,0,0,61.91,?

我使用以下java代码将sql数据库转换为csv,然后将csv转换为arff:

while (resultSet.next()) {
        row = spreadsheet.createRow(i);
        cell = row.createCell(0);
        cell.setCellValue(resultSet.getString("MouseVariance"));
        cell = row.createCell(1);
        cell.setCellValue(resultSet.getString("EyeValue"));
        cell = row.createCell(2);
        cell.setCellValue(resultSet.getString("SocialTime"));
        cell = row.createCell(3);
        cell.setCellValue(resultSet.getString("KeyWords"));
        cell = row.createCell(4);
        cell.setCellValue(resultSet.getString("InvolvedTime"));
        cell = row.createCell(5);
        cell.setCellValue("?");

                i++;
    }

但是当我以这种方式创建 arff 文件时,属性显示为

@attribute grade {numaric} value.

因此未预测预期成绩。 但如果如下所示就可以解决问题。

 @attribute grade {B,A,C}

我该如何解决这个问题?

最佳答案

听起来该属性不知道列表中可用标称值的列表。

也许 AddValues过滤器可能有助于将这些项目添加到列表中。您可以将 A、B 和 C 的值添加到名义变量中,从而使它们与训练数据一致。

如果这不是问题,请提供更多代码和生成的输出,我会进一步研究。

希望这有帮助!

关于java - 使用java在arff文件中定义属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27485377/

相关文章:

java - weka 3.8 中 "java code"缺少 LibSVM 包装器(我已经安装了它并且可以在实验器中看到它)

java - Weka可视化数据

java - WEKA源代码编译有错误

java - 当我们按 id 过滤列表时,如何使用 HQL 一对多查询关系

java - 如何设置多个 ImageView 的样式以不违反 JavaFX 11 中的 DRY

c# - 批量导出到 CSV

python - 将 csv 列从大纪元时间转换为人类可读的分钟数

c++ - 使用C++读取Excel文件的建议

java - 在 Spring 应用程序中从 JBOSS 4.2.3 配置 JNDI 数据源

java - 无法理解 TangoPoseData 中的 ij 术语