我一直在阅读有关成对排名的论文,但我不明白:
逐点排名和成对排名之间的训练/测试数据有什么区别? 这是我一直在读的论文: http://www.cs.cornell.edu/people/tj/publications/joachims_02c.pdf
在那里,它说pairwaise排名中的数据点是两个链接之间的不等式:
[行] .=。 [两个链接之间的不平等,即目标] qid:[qid] [[链接 1 和 2 的特征]:[1 和 2 的值]] # [info]
RankLib然而,它确实支持像 RankNet 和 RankBoost 这样的成对排名器,但它使用的数据点格式是逐点的。
[行] .=。 [绝对排名,即目标] qid:[qid] [feature1]:[value1] [feature2]:[value2] ... # [info]
我有什么遗漏的吗?
最佳答案
逐点排名类似于回归。每个点都有一个关联的排名分数,您想要预测该排名分数。因此,您的标记数据集将具有一个特征向量和给定查询的关联排名分数
即:{d1,r1} {d2,r2} {d3,r3} {d4,r4}
其中 r1 > r2 > r3 >r4
成对排名类似于分类。每个数据点都与另一个数据点相关联,目标是学习一个分类器,该分类器将预测这两个数据点中的哪一个与给定查询“更”相关。
即:{d1 > d2} {d2 > d3} {d3 > d4}
关于machine-learning - 机器学习中逐点排名和成对排名有什么区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17411986/