对于 Weka 来说相对较新,我想知道是否可以基于包含可变长度数据行的 CSV 文件来训练分类器。例如,一个 CSV 文件如下所示:
1, 2, 3, 4, 3, 2, 1
1, 2, 4, 3, 2, 1
...
虽然很基本,但这两条线都显示出清晰的模式。如果 Weka 分类器收到类似的模式,它能否有效地处理类似这样的 CSV 文件?
最佳答案
简而言之 - 不,这是一个困难的情况,不能简单地使用默认的 WEKA 模型来处理。此类数据需要进行预处理以获得 WEKA 可以处理的固定长度表示(可能有缺失值),或者使用一些可以处理此类数据的更复杂的模型。它看起来像一个时间序列,因此您应该寻找可以使用它的工具/模型。我建议查看 DTW(动态时间扭曲)和使用自定义距离测量(例如 KNN)而不是原始数据表示的分类器。
关于java - 使用Weka : Can Training Data be of Multiple Length?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20024448/