有人可以解释一下 Sample_weight 参数在各种 scikit-learn 性能指标中的作用吗,例如:
- 准确度得分 ( https://scikit-learn.org/stable/modules/generated/sklearn.metrics.accuracy_score.html )
- Jaccard_score ( https://scikit-learn.org/stable/modules/generated/sklearn.metrics.jaccard_score.html#sklearn.metrics.jaccard_score )
- F1 分数 ( https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html ) 等等
非常感谢。
最佳答案
它只是指示每个样本对指标的影响程度。看这个例子:
使用下面的y_true
和y_pred
,accuracy_score
将为0.6666666
:
y_true = [0, 0, 1]
y_pred = [0, 1, 1]
accuracy_score(y_true, y_pred) # 0.6666666666666666
但是,如果第二个样本对我们来说比其他两个样本更重要,我们可以使用 sample_weight
强制其重要性:
accuracy_score(y_true, y_pred, sample_weight=[1, 2, 1]) # 0.5
关于python - 各种性能指标中的sample_weight参数是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59907978/