python - 从 Django 获取多个随机对象时,查询集如何工作?

标签 python django django-models django-queryset

我需要从 Django 模型中获取多个随机对象。

我知道我可以通过键入以下内容从模型 Person 中获取一个随机对象:

person = Person.objects.order_by('?')[0]

然后,我在How to get two random records with Django中看到了建议说我可以简单地通过以下方式做到这一点:

people = Person.objects.order_by('?')[0:n]

但是,一旦我添加 [0:n],Django 不会返回对象,而是返回一个 QuerySet 对象。这会导致不幸的后果,如果我随后要求

print(people[0].first_name, people[0].last_name)

我得到了 2 个不同人的 first_name 和 last_name,因为 QuerySets 在被调用时被评估(对吗?)。如何获取从第一个查询返回的实际人员列表?

我正在使用 Python 3.4.0 和 Django 1.7.1

最佳答案

Simeon Popov 的回答解决了这个问题,但让我解释一下它的来源。

您可能知道查询集是惰性的,只有在必要时才会进行评估。它们还有一个内部缓存,一旦评估了整个 查询集,该缓存就会被填充。如果仅从查询集中获取单个对象(或指定了 step 的切片,即 [0:n:2]),Django 会评估它,但结果不会被缓存。

举这两个例子:

示例 1

>>> people = Person.objects.order_by('?')[0:n]
>>> print(people[0].first_name, people[0].last_name)
# first and last name of different people

示例 2

>>> people = Person.objects.order_by('?')[0:n]
>>> for person in people:
>>>     print(person.first_name, person.last_name)
# first and last name are properly matched

在示例 1 中,当您访问第一个项目时,查询集尚未计算。它不会被缓存,所以当您再次访问第一个项目时,它会在数据库上运行另一个查询。

在第二个示例中,当您遍历整个查询集时,它会被评估。因此,缓存已满,不会有任何额外的数据库查询会更改返回项的顺序。在这种情况下,名称彼此正确对齐。

评估整个查询集的方法是 a.o.迭代、list()bool()len()。这些方法之间存在一些细微差别。如果你只想确保查询集被缓存,我建议使用 bool(),即:

>>> people = Person.objects.order_by('?')[0:n]
>>> bool(people)
True
>>> print(people[0].first_name, people[0].last_name)
# matching names

关于python - 从 Django 获取多个随机对象时,查询集如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27208231/

相关文章:

python - 如何计算对象关键点相似度

python - Arcpy - 将 NA 图层保存到要素类

python - Django-Rest-Framework:我可以使用两种不同的方法(具有相同的 url_path 但不同的请求方法)创建 View 集吗?

Django - ModelChoiceField 查询集是如何工作的?

python - 恢复自动生成的迁移以重命名 Django 中的表时出错

python - 使用外键向 Django Rest Framework API 发送补丁请求

python - 多维数组之间的欧氏距离的 Numpy 运算

python 导入 MySQLdb

python - 在模型级别将 Django DateField 验证为一周中的特定日期的最佳做法是什么?

python - 设置文件中的 Django 应用程序发现问题。怎么解决?