machine-learning - WEKA:属性尺度问题

标签 machine-learning weka svm

我有一个训练数据集和多个测试集(我正在集群框架中对实例进行分类,因此测试集的实例是动态计算的)。

实例属性具有不同的标度(第一个从 0 到 1,第二个从 0 到 100)。

我的分类器(逻辑回归和 SMO)如何处理它们无法立即获得整个测试集的事实?

换句话说,如果他们不知道测试集中的最大值是多少,他们如何处理不同的尺度属性?

谢谢

最佳答案

根据Weka Javadocs ,SMO“默认对所有属性进行归一化。(请注意,输出中的系数基于归一化/标准化数据,而不是原始数据。)”也就是说,如果您的训练集未涵盖每个属性的完整范围。这有多糟糕取决于您的数据。

我建议您尝试使用标准化和不使用标准化进行训练(使用 setFeatureSpaceNormalization(false) 将其关闭),然后看看哪种效果最好。

关于machine-learning - WEKA:属性尺度问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5857490/

相关文章:

python - aws sagemaker训练管道模式读取随机字节数

python - 我在 pytorch "RuntimeError: invalid argument 2: size ' [-1 x 400] 上收到此错误

python-2.7 - python中的K最近邻

neural-network - 具有多个隐藏层的Weka多感知器

java - Weka:如何在 J48 决策树中实现代理分割?

machine-learning - 适合新手的 WEKA 教程/示例

r - 如何判断 R 是否仍在估计我的 SVM 模型或已崩溃?

unity-game-engine - 我如何知道代理正在协同工作?

machine-learning - SVM的增量学习

machine-learning - 一类 SVM 算法耗时太长