Weka 不会离散化最后一列

标签 weka data-mining

我正在使用 Weka 来离散化数据,但问题是它没有离散化最后一列。也有监督。Discretize 处于非事件状态。数据集有问题吗?

数据集:

@relation R_data_frame

@attribute V44 numeric
@attribute V178 numeric
@attribute V280 numeric

@data
0,3.7,8
0,17.6,6
0,14.2,10
...some more data

完整的数据集:
https://pastebin.com/raw/RmQ2pD3W

最佳答案

监督属性离散化要求类变量是分类变量。你的是数字,所以它不是一个选项。但是,您可以将其与监督离散化一起使用。首先选择

filters -> unsupervised -> attribute -> Discretize

Weka Window 1

接下来单击显示离散化的文本框(在显示选择的按钮旁边)以设置离散化选项。选项之一是 Ignore Class .默认情况下,这是 False。将其更改为 True。

Changing options for Discretize

现在点击 Apply 运行过滤器它将离散化所有三个变量。

关于Weka 不会离散化最后一列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52823603/

相关文章:

validation - Weka 是否在具有 10CV 的单独保留集上测试结果?

machine-learning - 数据挖掘和机器学习之间的区别

machine-learning - 您会使用什么算法根据人员属性进行聚类?

java - Weka java spreadsubsample 过滤器

java - 在 Java 中使用随机森林打印实际和预测的类标签

hadoop - 在 AWS 中使用 weka 将主机名分配给 hadoop 作业

algorithm - 使用遗传算法选择稀疏参数

machine-learning - weka AdaBoost 没有改善结果

java - 堆栈跟踪 : weka. core.WekaException : weka. classifiers.functions.SMO : Not enough training instances with class labels (required: 1, 提供 : 0)!

hadoop - hadoop的数据挖掘库