python - 各种性能指标中的sample_weight参数是什么

标签 python performance scikit-learn

有人可以解释一下 Sample_weight 参数在各种 scikit-learn 性能指标中的作用吗，例如:

准确度得分 ( https://scikit-learn.org/stable/modules/generated/sklearn.metrics.accuracy_score.html )
Jaccard_score ( https://scikit-learn.org/stable/modules/generated/sklearn.metrics.jaccard_score.html#sklearn.metrics.jaccard_score )
F1 分数 ( https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html ) 等等

非常感谢。

最佳答案

它只是指示每个样本对指标的影响程度。看这个例子:

使用下面的y_true和y_pred，accuracy_score将为0.6666666:

y_true = [0, 0, 1]
y_pred = [0, 1, 1]

accuracy_score(y_true, y_pred) # 0.6666666666666666

但是，如果第二个样本对我们来说比其他两个样本更重要，我们可以使用 sample_weight 强制其重要性:

accuracy_score(y_true, y_pred, sample_weight=[1, 2, 1]) # 0.5

关于python - 各种性能指标中的sample_weight参数是什么，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59907978/

上一篇：python - Keras自定义层输入形状兼容性问题

下一篇：python - 如何将函数应用于两列以创建第三列

相关文章：

machine-learning - 计算词性标注器准确度的参数

python - 伯努利朴素贝叶斯错误 : ValueError: Unknown label type: (array([0, 0, 0, ..., 0, 0, 0], dtype=object),)

python - Plotly:如何调整 slider 和更新菜单的位置以为 x 轴刻度线腾出空间？

c++ - 在 C++ 中对 float 变量执行算术运算时，是否总是需要使用 float 文字？

python - Matplotlib - imshow twiny() 问题

python - 生成不重复的二进制序列

php - ZF2模块加载性能

apache-spark - 来自 spark-sklearn 的 GridSearchCV 的 best_score_ 参数不适用于版本 0.2.3

python - 将日期框架重新格式化为新的输出格式

python - Pandas - GroupBy 2 列 - 无法重置索引

©2024 IT工具网联系我们