filter - WEKA 的重采样过滤器 - 如何解释结果

标签 filter machine-learning weka

我目前正在努力解决机器学习问题,而我必须处理大量不平衡的数据集。也就是说,有六个类('1','2'...'6')。不幸的是,有例如对于“1”类,有 150 个示例/实例;对于“2”,有 90 个实例;对于“3”类,只有 20 个实例。所有其他类都无法“训练”,因为这些类没有可用的实例。

到目前为止,我发现 WEKA(我正在使用的机器学习工具包)提供了这种受监督的“重新采样”过滤器。当我使用 'noReplacement'=false 和 'bialToUniformClass'=1.0 应用此过滤器时,这会产生一个数据集,其中实例的数量很好并且几乎相等(对于类 '1'..'3' 和其他类)留空)。

我现在的问题是:WEKA 和这个过滤器如何为不同的类生成"new"/附加实例。

提前非常感谢您提供任何提示或建议。

干杯 朱利安

最佳答案

事实并非如此。它正在对现有实例进行重新采样。如果您有一个 2 类实例,并要求以 1.0 的偏差进行重采样,则您可以预期该实例的 N 个副本以及已存在数据的每种其他类型的 N 个其他实例。

关于filter - WEKA 的重采样过滤器 - 如何解释结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1874645/

相关文章:

基于Set类型的Java流过滤器

python - 为什么我的分类器无法学习正类?

java - 如何在 WEKA 中打印出交叉验证后的预测类

java - 层次聚类中的距离/接近矩阵

machine-learning - WEKA LibSVM 成本权重参数

machine-learning - WEKA 输出中缺少值

r - if else 语句使用 R 中多列中的日期和匹配值来过滤行

c++ - 双矩阵的 OpenCV 中值滤波器

c - 如何制作 IIR 滤波器?

python - 我可以将所有 tensorflow slim 模型转换为 tflite 吗?