mysql - 每个连接的计数 - 优化

结果: 我使用了三种方法:

三个子查询，每个子查询 1 个连接(我的)
三个子查询，无连接，使用 where (SlimsGhost) 过滤
三重连接(Solarflare)

我用“explain”和“profiling”做了一些统计，解释了每个查询必须做的工作，以下结果并不令人惊讶:stats

相对结果:

100%
79%
1715%

原帖

想法是连接 4 个表，每次使用相同的 PK，然后计算每个连接将分别给出多少行。

显而易见的答案是使用子查询分别进行每个连接。

但是是否可以通过一个查询来完成呢？会不会更有效率？

select "LES CIGARES DU PHARAON" as "Titre",
          (select count( payalb.idPays)
          from album alb
                     left join pays_album payalb using ( idAlb )
          where alb.titreAlb = "LES CIGARES DU PHARAON") as "Pays",
          (select count( peralb.idPers)
          from album alb
                     left join pers_album peralb using ( idAlb )
          where alb.titreAlb = "LES CIGARES DU PHARAON") as "Personnages",
          (select count( juralb.idJur)
          from album alb
                     left join juron_album juralb using ( idAlb )
          where alb.titreAlb = "LES CIGARES DU PHARAON") as "Jurons"
; 
+------------------------+------+-------------+--------+
| Titre                  | Pays | Personnages | Jurons |
+------------------------+------+-------------+--------+
| LES CIGARES DU PHARAON |    3 |          13 |     50 |
+------------------------+------+-------------+--------+

相册行数:22

表 pays_album 行:45

表 personnage_album 行:100

表 juron_album 行:1704

这是我尝试过的:

select alb.titreAlb as "Titre",
         sum(case when alb.idAlb=payalb.idAlb then 1 else 0 end) "Pays",
         sum(case when alb.idAlb=peralb.idAlb then 1 else 0 end) "Personnages",
         sum(case when alb.idAlb=juralb.idAlb then 1 else 0 end) "Jurons"
from album alb
          left join pays_album payalb using ( idAlb )
          left join pers_album peralb using ( idAlb )
          left join juron_album juralb using ( idAlb )
where alb.titreAlb = "LES CIGARES DU PHARAON"
group by alb.titreAlb
;
+------------------------+------+-------------+--------+
| Titre                  | Pays | Personnages | Jurons |
+------------------------+------+-------------+--------+
| LES CIGARES DU PHARAON | 1950 |        1950 |   1950 |
+------------------------+------+-------------+--------+

但它计算了完整连接表的总行数，... (1950 = 3 * 13 * 50)

架构:https://github.com/LittleNooby/gbd2015-2016/blob/master/tintin_schema.png

表格内容:https://github.com/LittleNooby/gbd2015-2016/blob/master/tintin_description

如果你想玩就玩吧:

数据库初始化:https://github.com/LittleNooby/gbd2015-2016/blob/master/tintin_ok.mysql

最佳答案

出于优化目的，一个好的经验法则是加入更少，而不是更多。事实上，您应该尝试连接尽可能少的行和尽可能少的行。通过任何额外的连接，您将增加成本而不是增加成本。因为 mysql 基本上只会生成一个大的乘积矩阵。不过，其中很多都被索引和其他东西优化掉了。

但要回答您的问题:实际上可以只用一个大连接进行计数，假设表具有唯一键并且 idalb 是相册的唯一键。然后，也只有到那时，您才能像您的代码一样执行此操作:

select alb.titreAlb as "Titre",
       count(distinct payalb.idAlb, payalb.PrimaryKeyFields) "Pays",
       count(distinct peralb.idAlb, peralb.PrimaryKeyFields) "Personnages",
       count(distinct juralb.idAlb, juralb.PrimaryKeyFields) "Jurons"
from album alb
left join pays_album payalb using ( idAlb )
left join pers_album peralb using ( idAlb )
left join juron_album juralb using ( idAlb )
where alb.titreAlb = "LES CIGARES DU PHARAON"
group by alb.titreAlb

其中 PrimaryKeyFields 代表连接表的主键字段(您必须查找它们)。

Distinct 将消除其他连接对计数的影响。但不幸的是，一般来说，distinct 不会消除连接对成本的影响。

尽管如此，如果您的索引覆盖了表的所有 (idAlb + PrimaryKeyFields) 字段，那可能甚至与原始解决方案一样快(因为它可以优化 distinct 不做排序)并且会接近您的想法(只需遍历每个表/索引一次)。但在正常或最坏情况下，它的性能应该比合理的解决方案(如 SlimGhost 的解决方案)更差——因为它能否找到最佳策略值得怀疑。但是尝试一下并检查解释(并发布发现)，也许 mysql 会做一些疯狂的事情。

关于mysql - 每个连接的计数 - 优化，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37199736/

mysql - 每个连接的计数 - 优化

上一篇：php - MySQL、PHP : Select * from table where id is not in array

下一篇：MySQL:显示 3 个表中的所有行