machine-learning - 一类支持向量机

标签 machine-learning cluster-analysis analytics data-mining svm

所以我想确保我的权利是正确的。首先,我是一名计算机工程专业的本科生,拥有比软件更多的硬件/EE 经验。今年夏天,我发现自己正在使用一种使用一类 SVM 的聚类算法。 SVM 只是一个用于分类/分离输入数据的数学模型吗? SVM 在具有一个属性/变量的数据集上运行良好吗?我猜不会是后者,可能是因为使用单个属性进行分类实际上是刻板印象。我的猜测是,SVM 在具有多个属性/变量有助于分类的数据集上表现更好。提前致谢!

最佳答案

SVM 尝试构建分离 2 个类的超平面(据我所知,在一类 SVM 中,一类用于“正常”实例,一类用于“异常”实例)。只有一个属性,您就拥有一维空间,即线。因此,这里的超平面是线上的一个。如果 2 个类的实例(这条线上的点)可以被这个超平面点分开(即它们是线性可分离的),那么可以使用 SVM。否则不会。

请注意,对于几个属性,SVM 仍然可以用于对线性不可分离的实例进行分类。在下一张图像上,二维空间中有 2 个类(2 个属性 - X 和 Y),一个用蓝点标记,另一个用绿色点标记。

enter image description here

你无法画出将它们分开的线。不过,所谓的kernel trick可以通过组合现有属性来产生更多属性。有了更多的属性,您可以获得更高维度的空间,其中所有实例都可以被分离( video )。不幸的是,一个属性不能与其自身组合,因此对于一维空间核技巧不适用。

所以,你的问题的答案是:当且仅当两个类的实例本身可线性分离时,SVM 才可以用于仅具有一个属性的集合

关于machine-learning - 一类支持向量机,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6866552/

相关文章:

apache-spark - 集群场景 : Difference between the computedCost of 2 points used as similarity measure between points. 是否适用?

architecture - Azure 上的高流量、每天超过 5 亿次点击(类似分析)的应用程序架构

sql - 如何让结果集的总数出现在每条输出记录中?

python - 为什么我的accuracy_score指标不正确? scikit学习

python - xgboost 的并行线程?

python-3.x - Keras 模型给出 TypeError : only size-1 arrays can be converted to Python scalars

artificial-intelligence - 从街景图像中提取监控摄像头位置

machine-learning - 一种视觉上可分离簇的聚类算法

matlab - 树状图中的关联标签 - MATLAB

ios - 使用 Restkit 监控网络调用 IOS