algorithm - 了解 PageRank 和类似算法背后的数学原理

标签 algorithm math pagerank

我查看了本网站上提出的类似问题所提供的大量资源,目前最有帮助的是在此讨论中找到的,资源链接在这里:PageRank Explained. .

虽然这提供了详细的概述,但我正在寻找更具体的内容。虽然我意识到还有其他因素在起作用,并且算法自诞生以来已经发生了多次变化,但从每个链接传递的值的一个很好的指示是:PageRank 除以链接的总页数。因此,如果一个站点(页面)的 PR 为 8,并且链接到 20 个站点,则传递给每个站点的总值(value)为 8/20。至少我是这么认为的。我知道 PageRank 是一个介于 1 - 10 之间的对数值,这意味着从 PR 1 到 2 比 PR 9 到 10 困难得多。这就是我感到困惑的地方 - 如何计算数量PR 转移到每个链接。我非常简化事情,因为具有 PR 10 和大约 10 个出站链接的页面应该仍然比具有 2 个出站链接的 PR 5 站点传递更多的值(value)。在简单的层面上理解其背后正确数学的最佳方法是什么?

最佳答案

首先,值得注意的是,当前实现的 PageRank 与论文中的原始想法大不相同,并且由于它一直在变化,甚至该 SO 问题中的其他信息也不完全可靠。但我想基本面是相似的。

我认为 PageRank 在转换为对数刻度之前被划分,因此如果您的 PageRank 为 P 并且 n > 0 出站链接,则转移的 PR 将是(由于衰减因子,略小于)P - log_10名词因此,如果有 10 个链接,PR 将下降 1,如果有 100 个链接,则 PR 会下降 2,依此类推。当然,如果 n 为 0,则不会为其他页面提供 PageRank,这只是浪费。

关于algorithm - 了解 PageRank 和类似算法背后的数学原理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3841851/

相关文章:

python - 计算两条曲线之间的面积

wordpress - 将 domain.com/keyword 作为主页 URL

algorithm - Page Rank 算法中的随机性和原始性顺序

algorithm - 计数,反转位模式

algorithm - 单个查询中两个值之间的插值

javascript - 使用 jQuery 获取具有类的所有元素的总美元

javascript - 有效地在 JavaScript 中添加十六进制字符串

machine-learning - 适用于大图的 PageRank 工具

algorithm - 找到点之间最小距离的最快方法

c# - 在 C# 中查找闭合形状