java - 使用Weka : Can Training Data be of Multiple Length?

标签 java csv machine-learning classification weka

对于 Weka 来说相对较新,我想知道是否可以基于包含可变长度数据行的 CSV 文件来训练分类器。例如,一个 CSV 文件如下所示:

1, 2, 3, 4, 3, 2, 1
1, 2, 4, 3, 2, 1
...

虽然很基本,但这两条线都显示出清晰的模式。如果 Weka 分类器收到类似的模式,它能否有效地处理类似这样的 CSV 文件?

最佳答案

简而言之 - 不,这是一个困难的情况,不能简单地使用默认的 WEKA 模型来处理。此类数据需要进行预处理以获得 WEKA 可以处理的固定长度表示(可能有缺失值),或者使用一些可以处理此类数据的更复杂的模型。它看起来像一个时间序列,因此您应该寻找可以使用它的工具/模型。我建议查看 DTW(动态时间扭曲)和使用自定义距离测量(例如 KNN)而不是原始数据表示的分类器。

关于java - 使用Weka : Can Training Data be of Multiple Length?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20024448/

相关文章:

python - 打印报表在时限后消失

python-3.x - 如何为 POS 标签生成 GloVe 嵌入? Python

python - 我可以用特定的数据集替换 'make_blobs' 吗?

python - sklearn 中的轮廓系数子采样是否分层?

Java boolean 值未从 if 语句中传递出去

java - 如何在另一个项目中创建 JavaFX 项目并在 IntelliJ 中打开它

java - 将 byte[] 转换为 UnsignedByte[]

java - 运行 docx4j createhtml.java 文件时出错

java - 对值列进行排序 CSV java

java - 在java web应用程序中将avro文件转换为csv