任何人都可以提供有关对集合相似性进行排名的方法的指导吗?
我有 2 位用户通过勾选"is"、“否”和“也许”3 个单选按钮来回答问题。
谁能提出一种算法来比较受访者对每个问题的答案的相似性(单独比较和整体比较)?我必须在 PHP/MySQL 平台上实现这个。
谢谢
最佳答案
您似乎想要计算相关性的强度。
对于每个响应对,通过测量两个答案之间的距离来计算相似度。将“否”、“也许”、"is"视为 0、1、2(或 1、2、3,如果更适合 PHP),然后简单地从响应 B 中减去响应 A。
因此,对于受访者 A 和 B,我们计算距离d:
A B d
0 0 Abs(0 - 0) = 0
0 1 Abs(1 - 0) = 1
0 2 Abs(2 - 0) = 2
1 0 Abs(0 - 1) = 1
1 1 Abs(1 - 1) = 0
1 2 Abs(2 - 1) = 1
2 0 Abs(0 - 2) = 2
2 1 Abs(1 - 2) = 1
2 2 Abs(2 - 2) = 0
这将为您提供问题的相似度分数。现在,要确定一组问题的答案的相似性,您所需要做的就是添加分数并将其表示为最大可能分数的分数。 MaxScore 就是最大距离乘以问题数量(例如,对于 100 个问题,最大分数为 200)
如果每个问题有五个可能的答案,则 100 个问题的最高得分将为 400。
关于php - 如何比较 2 个用户在单选按钮上的输入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11895008/