数据库中有几百条图书记录,每条记录都有一个发布时间。在网站的首页,我被要求写一些代码来随机挑选 10 本书并把它们放在那里。要求是新书需要有更高的展示机会。
由于时间是一个整数,我想这样计算每本书的概率:
Probability of a book to be drawn = (current time - publish time of the book) / ((current time - publish time of the book1) + (current time - publish time of the book1) + ... (current time - publish time of the bookn))
抽到一本书后,下一轮循环将分母减去(当前时间-该书的出版时间),对剩余的每本书重新计算概率,循环下去,直到抽到10本书为止绘制。
这个算法正确吗?
顺便说一下,该网站是用 PHP 编写的。
如果您有更好的算法,请随意推荐一些 PHP 代码。
非常感谢大家。
最佳答案
这里有一个非常相似的问题可能会有所帮助:Random weighted choice解决方案是在 C# 中,但代码可读性很强并且接近 PHP 语法,因此应该很容易适应。
例如,下面是如何在 MySQL 中执行此操作:
首先计算所有书籍的总年龄并将其存储在一个MySQL用户变量中:
SELECT SUM(TO_DAYS(CURDATE())-TO_DAYS(publish_date)) FROM books INTO @total;
然后随机选择书籍,按年龄加权:
SELECT book_id FROM (
SELECT book_id, TO_DAYS(CURDATE())-TO_DAYS(publish_date) AS age FROM books
) b
WHERE book_id NOT IN (...list of book_ids chosen so far...)
AND RAND()*@total < b.age AND (@total:=@total-b.age)
ORDER BY b.publish_date DESC
LIMIT 10;
请注意,@total
只有在一本书通过随机选择测试时才会减少,因为 AND
表达式短路。
这不能保证在一次传递中选择 10 本书——它甚至不能保证在给定的传递中选择任何本书。所以你必须重新运行第二步,直到你找到 10 本书。 @total
变量保留其减少的值,因此您不必重新计算它。
关于php - 使最近的项目更有可能被绘制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2959403/