python - 从 Django 获取多个随机对象时，查询集如何工作？

我需要从 Django 模型中获取多个随机对象。

我知道我可以通过键入以下内容从模型 Person 中获取一个随机对象:

person = Person.objects.order_by('?')[0]

然后，我在How to get two random records with Django中看到了建议说我可以简单地通过以下方式做到这一点:

people = Person.objects.order_by('?')[0:n]

但是，一旦我添加 [0:n]，Django 不会返回对象，而是返回一个 QuerySet 对象。这会导致不幸的后果，如果我随后要求

print(people[0].first_name, people[0].last_name)

我得到了 2 个不同人的 first_name 和 last_name，因为 QuerySets 在被调用时被评估(对吗？)。如何获取从第一个查询返回的实际人员列表？

我正在使用 Python 3.4.0 和 Django 1.7.1

最佳答案

Simeon Popov 的回答解决了这个问题，但让我解释一下它的来源。

您可能知道查询集是惰性的，只有在必要时才会进行评估。它们还有一个内部缓存，一旦评估了整个查询集，该缓存就会被填充。如果仅从查询集中获取单个对象(或指定了 step 的切片，即 [0:n:2])，Django 会评估它，但结果不会被缓存。

举这两个例子:

示例 1

>>> people = Person.objects.order_by('?')[0:n]
>>> print(people[0].first_name, people[0].last_name)
# first and last name of different people

示例 2

>>> people = Person.objects.order_by('?')[0:n]
>>> for person in people:
>>>     print(person.first_name, person.last_name)
# first and last name are properly matched

在示例 1 中，当您访问第一个项目时，查询集尚未计算。它不会被缓存，所以当您再次访问第一个项目时，它会在数据库上运行另一个查询。

在第二个示例中，当您遍历整个查询集时，它会被评估。因此，缓存已满，不会有任何额外的数据库查询会更改返回项的顺序。在这种情况下，名称彼此正确对齐。

评估整个查询集的方法是 a.o.迭代、list()、bool() 和 len()。这些方法之间存在一些细微差别。如果你只想确保查询集被缓存，我建议使用 bool()，即:

>>> people = Person.objects.order_by('?')[0:n]
>>> bool(people)
True
>>> print(people[0].first_name, people[0].last_name)
# matching names

关于python - 从 Django 获取多个随机对象时，查询集如何工作？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27208231/

python - 从 Django 获取多个随机对象时，查询集如何工作？

上一篇：python - Scapy TCP 校验和重新计算奇怪的行为

下一篇：python - 使用 SVM 的命名实体特征选择