r - Microsoft rxOneClassSVM 的预测分数意味着什么?

标签 r machine-learning svm microsoft-r anomaly-detection

我正在尝试使用 Microsoft ML 包构建一个单类 SVM 模型来进行新颖性检测,并设法获得一些结果。使用测试数据的预测结果包含“Score”列,我不太确定这里的含义。当我在网上搜索时,没有很好的解释。

作为机器学习的初学者,我猜测分数在一定程度上代表了数据点成为真正异常的概率,因为分数越高,数据输入就越有可能是异常。如果我错了,请纠正我,我也想知道确定阈值的算法。我知道一些,例如 GA,但对于如何选择合适的使用感到非常困惑。

谢谢!

最佳答案

您关于“分数越高 - 异常的可能性越大”的说法是正确的。为了找到阈值,我使用 rxLinePlot 绘制如下图:plotting scores in oneclasssvm

从上图中可以看出,阈值是任何大于0.1的值。此类图将有助于根据您的用例确定阈值。如果您希望在您的计算机上生成此图,这里是完整的 R 代码:https://gist.github.com/ramnov/b08224b06c75d613688f0c8d61511d9b

关于r - Microsoft rxOneClassSVM 的预测分数意味着什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44124527/

相关文章:

string - R:将数据框行转换为字符向量

r - 如何创建循环以在 R 中生成随机样本列表?

image-processing - 特征值和主成分之间的关​​系

hadoop - Mahout 中的逻辑回归\SVM 实现

scikit-learn - scikit-learn 中的 Nu_SVR 没有详细信息

r - 导入带有日期的 Excel 文件,显示为数字,尝试返回日期格式

r - 在不切断图形或丢失数据的情况下更改 ggplot 中的 y 轴限制

machine-learning - CNN 在我的 Keras 数据集上效率不高

machine-learning - 如何查看每个单词的 tf-idf 分数

opencv - 用于上半身检测的经过训练的 HOG 描述符