我有这种格式的数据:我有数据量和每个函数的处理时间的元组。我想通过“class”属性进行分类
这是一个示例:
Amount-F1 Time-F1 Amount-F2 Time-F2 [...] Class
50 10 20 10 1
20 2 100 20 3
...
我应该如何构建arff文件?我应该使用(Ammount,Time)元组的关系属性还是应该使用“常规”属性?
您能为我制作一个示例 arff 文件吗?
谢谢
最佳答案
WEKA 还可以处理 csv 文件。但如果你想使用arff格式,WEKA确实支持: weka.core.converters.ArffSaver / weka.core.converters.CSVLoader
您可以将每个元组拆分为2个单独的功能:
@RELATION yourTable
@ATTRIBUTE Amount-F1 NUMERIC
@ATTRIBUTE Time-F1 NUMERIC
@ATTRIBUTE Amount-F2 NUMERIC
@ATTRIBUTE Time-F2 NUMERIC
@ATTRIBUTE Amount-F3 NUMERIC
@ATTRIBUTE Time-F3 NUMERIC
...
@ATTRIBUTE Class {1,2,3} % your class labels
@DATA
50, 10, 20, 10, 1
20, 2, 100, 20, 3
...
或使用时间和金额的聚合:
金额-F1和时间-F1为F1:
@RELATION yourTable
@ATTRIBUTE F1 NUMERIC
@ATTRIBUTE F2 NUMERIC
@ATTRIBUTE F3 NUMERIC
...
@ATTRIBUTE Class {1,2,3} % your class labels
@DATA
5, 2, 1 % 50/10, 20/10, 1
10, 5, 3 % 20/2, 100/20, 3
...
根据用例,通常我更喜欢第二种选择。
关于java - Weka 中的关系数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46339556/