我正在尝试使用 Microsoft ML 包构建一个单类 SVM 模型来进行新颖性检测,并设法获得一些结果。使用测试数据的预测结果包含“Score”列,我不太确定这里的含义。当我在网上搜索时,没有很好的解释。
作为机器学习的初学者,我猜测分数在一定程度上代表了数据点成为真正异常的概率,因为分数越高,数据输入就越有可能是异常。如果我错了,请纠正我,我也想知道确定阈值的算法。我知道一些,例如 GA,但对于如何选择合适的使用感到非常困惑。
谢谢!
最佳答案
您关于“分数越高 - 异常的可能性越大”的说法是正确的。为了找到阈值,我使用 rxLinePlot 绘制如下图:plotting scores in oneclasssvm
从上图中可以看出,阈值是任何大于0.1的值。此类图将有助于根据您的用例确定阈值。如果您希望在您的计算机上生成此图,这里是完整的 R 代码:https://gist.github.com/ramnov/b08224b06c75d613688f0c8d61511d9b
关于r - Microsoft rxOneClassSVM 的预测分数意味着什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44124527/