java - Weka 中的关系数据?

标签 java machine-learning weka

我有这种格式的数据:我有数据量和每个函数的处理时间的元组。我想通过“class”属性进行分类

这是一个示例:

Amount-F1 Time-F1 Amount-F2 Time-F2 [...] Class
50         10      20        10            1
20         2       100       20            3
...

我应该如何构建arff文件?我应该使用(Ammount,Time)元组的关系属性还是应该使用“常规”属性?

您能为我制作一个示例 arff 文件吗?

谢谢

最佳答案

WEKA 还可以处理 csv 文件。但如果你想使用arff格式,WEKA确实支持: weka.core.converters.ArffSaver / weka.core.converters.CSVLoader

您可以将每个元组拆分2个单独的功能:

@RELATION yourTable

@ATTRIBUTE Amount-F1 NUMERIC
@ATTRIBUTE Time-F1 NUMERIC
@ATTRIBUTE Amount-F2 NUMERIC
@ATTRIBUTE Time-F2 NUMERIC
@ATTRIBUTE Amount-F3 NUMERIC
@ATTRIBUTE Time-F3 NUMERIC
...
@ATTRIBUTE Class {1,2,3} % your class labels

@DATA
50, 10, 20, 10, 1
20, 2, 100, 20, 3
...

或使用时间金额聚合:

金额-F1时间-F1F1:

@RELATION yourTable

@ATTRIBUTE F1 NUMERIC
@ATTRIBUTE F2 NUMERIC
@ATTRIBUTE F3 NUMERIC
...
@ATTRIBUTE Class {1,2,3} % your class labels

@DATA
5, 2, 1    % 50/10, 20/10, 1
10, 5, 3   % 20/2, 100/20, 3
...

根据用例,通常我更喜欢第二种选择。

关于java - Weka 中的关系数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46339556/

相关文章:

python - NLTK/NLP 构建多对多/多标签主题分类器

通过调整和交叉验证进行随机森林优化

authentication - WEKA 中加速度计缺失数据和分类

java - weka,命令行,设置路径,java

java - HikariCP - 空闲超时属性未覆盖

python - 如何正确删除 Scikit-Learn 的 DPGMM 的冗余组件?

java - Spring SimpleTriggerContext 获取正确的 nextExecutionTime

java - 使用 Java 中的 WEKA 打印预测结果

java - 无论如何要通过 JVMTI 获得 jthread tid?

java - Java中的抽象与封装