我以以下方式实现了页面排名收敛,
总结所有页面的所有页面等级得分,并与之前的迭代进行比较。我的一位 friend 给了我以下解释:
“如果您查看pagerank论文,他们会指出,其实现会导致所有分数总和为1,并且这些总和在多次迭代中都不会改变。
这是从论文中得出的:“请注意,PageRanks在网页上形成了概率分布,因此所有网页的PageRanks的总和将为1”
寻找页面排名算法是否收敛的正确方法是什么?请注意,我正在Hadoop和Spark中实现页面排名。请指教,我很困惑。
最佳答案
您可以像在任何迭代算法中一样定义收敛。如果迭代之间的估计参数变化小于阈值,则算法收敛。
关于hadoop - 检查页面排名收敛,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41068735/