python - 多评估者数据的评估者间可靠性计算

我有以下列表:

[[1, 1, 1, 1, 3, 0, 0, 1],
 [1, 1, 1, 1, 3, 0, 0, 1],
 [1, 1, 1, 1, 2, 0, 0, 1],
 [1, 1, 0, 2, 3, 1, 0, 1]]

我想在哪里计算 inter-rater可靠性分数，有多个评分者(行)。我不能使用 Fleiss 的 kappa，因为行的总和不等于相同的数字。在这种情况下什么是好的方法？

最佳答案

这个问题的一个答案是使用 krippendorff alpha 分数:

Wikipedia Description

Python Library

import krippendorff

arr = [[1, 1, 1, 1, 3, 0, 0, 1],
       [1, 1, 1, 1, 3, 0, 0, 1],
       [1, 1, 1, 1, 2, 0, 0, 1],
       [1, 1, 0, 2, 3, 1, 0, 1]]    
res = krippendorff.alpha(arr)

关于python - 多评估者数据的评估者间可靠性计算，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56481245/

上一篇：python - 如何对通用函数进行类型检查

下一篇：python - 如何将多列及其标题转换为行

相关文章：

python - 列表字典到数据框

python - 如何在python中查找代码的统计信息和执行时间

python - scipy.stats.norm 密度函数未积分为 1

python - 在 ubuntu 12.04 中编译 statsmodels 示例

python - 如何使用 Python 中的时间序列预测来预测 future 日期？

python - 无法安装 Statsmodels...python

python - nginx/bottle python - 将请求路由到另一个端口

python - pytest 属性错误 : 'Function' object has no attribute 'get_marker'

python - Pandas:扁平化不一致行中的数据

statistics - Stata 对宏的行为，不同的输出