python - 带有注释的Django查询集，为什么GROUP BY应用于所有字段？

我将 Django 1.6 与 PostgreSQL 一起使用，并具有以下模型:

# models.py
class Game(AbstractContentModel, AbstractScoreModel):
    name = models.CharField(_("name"), max_length=100, blank=True)
    developer = models.CharField(_('Developer'), max_length=255)
    distributor = models.CharField(_('Distributor'), max_length=255, blank=True)
    # ...
    reviews = models.ManyToManyField(Review, related_name="games", blank=True, verbose_name=_("Reviews"))
    videos = models.ManyToManyField(Video, related_name="games", blank=True, verbose_name=_("Videos"))
    images = models.ManyToManyField(Image, related_name="games", blank=True, verbose_name=_("Gallery"))

我正在尝试获取所有游戏，并为每个游戏添加相关视频、评论和图片的数量，如下所示:

# views.py
qs = Game.objects.all()
qs = qs.annotate(video_count=models.Count('videos'))
qs = qs.annotate(review_count=models.Count('reviews'))
qs = qs.annotate(image_count=models.Count('images'))

查询结果为:

SELECT 
"content_game"."id", 
"content_game"."name",
"content_game"."developer", 
"content_game"."distributor",
COUNT("content_game_videos"."video_id") AS "video_count",
COUNT("content_game_reviews"."review_id") AS "review_count", 
COUNT("content_game_images"."image_id") AS "image_count" 
FROM "content_game" 
LEFT OUTER JOIN "content_game_videos" ON ( "content_game"."id" = "content_game_videos"."game_id" )
LEFT OUTER JOIN "content_game_reviews" ON ( "content_game"."id" = "content_game_reviews"."game_id" ) 
LEFT OUTER JOIN "content_game_images" ON ( "content_game"."id" = "content_game_images"."game_id" ) 
GROUP BY 
"content_game"."id", 
"content_game"."name",
"content_game"."developer", 
"content_game"."distributor";

我的问题是 - 为什么 GROUP BY 子句中有所有选定的字段？最重要的是，除了原始 SQL，我怎样才能摆脱它们？

我认为使用 .values() 会很好，但我想要结果查询中的每个字段。如果我只是使用 GROUP BY "content_game"."id"，结果是一样的，但我不知道如何在 Django ORM 中像这样使用它。

最佳答案

我来不及回答了，但我已经研究过答案了。首先，OP所说的行为是正确的。它应该适用于所有类型的关系数据库，但正如@lad2025 在评论中所说，唯一的 MySQL(以及 MariaDB)可以为这种行为辩解。因此，与其摆脱它，不如学习它。因为这是使用它/理解它并习惯它的唯一正确方法。

目前 OP 已经找到了解决方案，即继续使用某处的行数更新表字段并稍后填充而不是通过查询即时检索数据。

因为在使用聚合函数时，您添加到 GROUP BY 中的任何内容都必须包含到 SELECT 中，反之亦然。

"content_game"."id", "content_game"."name", "content_game"."developer",  "content_game"."distributor"

以上字段必须进入 GROUP BY，因为如果我尝试从选择中打印 id 或任何字段，这应该返回哪个行的字段(单个)值？组束中的最后一行或第一行不正确(MySQL 这样做)。所以最好将所有内容都放入 GROUP BY 中。

为什么？由于歧义 - group by 为每组记录生成一条记录。 Group By 列包含组中所有记录的相同值，任何聚合函数都会为组生成单个值，但 "content_game"."developer" 可以不同对于 "content_game"."distributor" 组 "content_game"."id" 对于所有行都是不同的，因为它是主键。所有领域都一样。

可以找到很好的解释here

我希望人们以更好的方式分享(编辑我的帖子)更多声明。这样其他人将来会发现这很有用。

关于python - 带有注释的Django查询集，为什么GROUP BY应用于所有字段？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34284778/

python - 带有注释的Django查询集，为什么GROUP BY应用于所有字段？

上一篇：python - Spark : More Efficient Aggregation to join strings from different rows

下一篇：python - Theano CUDA 异常