MySQL:如何选择和处理 "n to n"相关数据以提高性能

标签 mysql sql performance select relationship

作业:
我需要选择具有多对多关系的数据并寻找性能良好的解决方案。我目前有两个可行的解决方案(见下文)。

示例/说明:
竞赛由组织插入。一场比赛可以没有、一个或多个组织作为发起人。我只需要每场比赛的结果中包含一次发起人的 ID 列表。

数据结构:
- 表“竞赛”:(id,名称)
- 表“组织”:(id,名称)
- 表“competition_organization”:(competitionID、organizationID)

所需结果:
|id|姓名|promoter_list|
|1|欧洲冠军联赛|1241|
|2|FIFA世界杯|1240|
|3|FIFA 世界杯预赛 - 非洲|1240, 1242|

开发平台: Cold Fusion

数据库: MySQL

基于给定答案的附加说明:
- 我的问题的主要意图是找到一种比过去更好地处理这种关系的方法。比赛只是我需要的一个例子。
- 我试图让它更简单,也许我太多地忽略了一个事实。在我的应用程序中,我还需要组织名称。因此,我加入了组织表。
- 竞赛的相关信息比我在本例中描述的要多。我的应用程序中的查询使用了与其他表的多个联接。

<小时/>

解决方案1:
- 查询选择比赛数据
- 循环结果
- 将每个记录存储在循环内的数组中
- 用于为结果/循环中的每个记录选择启动子的附加查询
- 将启动子 ID 和另一个查询循环添加到数组中

主要查询:

SELECT competition.id, competition.name
FROM competition
WHERE ...

循环内的附加启动子查询:

SELECT DISTINCT organisation.id 
FROM organisation 
INNER JOIN competition_organisation 
ON competition_organisation.organisationID = organisation.id 
WHERE competition_organisation.competitionID = competition.id[currentrow]#
<小时/>

解决方案 2:
- 仅使用一个带有子选择的查询
- 循环结果
- 将每个记录存储在循环内的数组中

SELECT competition.id, competition.name,
(
    SELECT CONVERT(GROUP_CONCAT(organisation.id SEPARATOR ', ') USING utf8)
    FROM organisation
    WHERE organisation.id in 
    (
        SELECT DISTINCT competition_organisation.organisationID 
        FROM competition_organisation
        WHERE competition_organisation.competitionID = competition.id
    )
) AS promoter_list
FROM competition
WHERE ...
<小时/>

解决方案3(由Spencer7593提出):

SELECT c.id, 
       c.name,
       CONVERT(GROUP_CONCAT(DISTINCT o.id ORDER BY o.id) USING utf8) AS promoter_id_list,
       CONVERT(GROUP_CONCAT(DISTINCT o.name ORDER BY o.id) USING utf8) AS promoter_list
FROM competition c
LEFT JOIN competition_organisation c_o ON c_o.competitionID = c.id
LEFT JOIN organisation o ON o.id = c_o.organisationID
GROUP BY c.id, c.name

(我稍微更改了代码并添加了组织名称)

<小时/>

解决方案 4(由 Thorsten Kettner 提出,由 Rick James 优化):

SELECT id, name,
       ( SELECT CONVERT(GROUP_CONCAT(organisationID SEPARATOR ', ') USING utf8)         
             FROM competition_organisation
             WHERE competitionID = c.id
       ) AS promoter_id_list,
       ( SELECT CONVERT(GROUP_CONCAT(organisation.name SEPARATOR ', ') USING utf8)          
             FROM competition
             left join competition_organisation on competition_organisation.competitionID = competition.id
             left join organisationen on organisationen.id = competition_organisation.organisationID
             WHERE competitionID = c.id
       ) AS promoter_list
    FROM competition AS c

(还添加了组织名称,希望以正确的方式)

<小时/>

性能比较:

解决方案 1 - 100 条记录:~30ms + (100 x ~1ms) = ~130ms
解决方案 1 - 1000 条记录:~70ms + (1000 x ~1ms) = ~1070ms

解决方案 2 - 100 条记录:~5500ms
解决方案 2 - 1000 条记录:~48000ms

解决方案 3 - 100 条记录:~120ms
解决方案 3 - 1000 条记录:约 210 毫秒

解决方案 4 - 100 条记录:~110ms
解决方案 4 - 1000 条记录:约 200 毫秒

<小时/>

如您所见,解决方案 2 的性能很差。

  • 是否有选项可以优化解决方案 2 查询以显着提高性能?
  • 还有我没有想到的替代解决方案吗?
  • 或者我应该保留解决方案 1?
<小时/>

结论:

我决定采用 Spencer 的解决方案 3。 3 和 4 的性能几乎相同。但 3 的代码更简单,并且与我现有的查询完美匹配,特别是与他们的左连接。

我对结果非常满意。性能已大大提高,将来我需要更少的代码/文件。

非常感谢您的帮助!

最佳答案

解决方案3:

利用外连接操作和 MySQL 特定的 GROUP_CONCAT 聚合函数返回以逗号分隔的 Organizationid 值列表。

-- SHOW VARIABLES LIKE 'group_concat_max_len';
-- SET group_concat_max_len = 1048576;

SELECT c.id      AS id
     , c.name    AS name
     , GROUP_CONCAT(DISTINCT p.organisationid ORDER BY p.organisationid) AS promoter_list
  FROM competition c
  LEFT
  JOIN competition_organisation p
    ON p.competitionid = c.id
 GROUP
    BY c.id
     , c.name
 ORDER
    BY c.id
     , c.name

请注意,如果 GROUP_CONCAT 生成的字符串长度超过 group_concat_max_len,该字符串将被静默截断为允许的长度。 (没有错误,没有警告)。

将返回的字符串的字节长度与系统变量的值进行比较,以检测字符串是否被截断。

<小时/>

如果需要或有充分的理由,organization 表也可以包含在查询中。

SELECT c.id      AS id
     , c.name    AS name
     , GROUP_CONCAT(DISTINCT o.id ORDER BY o.id) AS promoter_list
  FROM competition c
  LEFT
  JOIN competition_organisation p
    ON p.competitionid = c.id
  LEFT
  JOIN organisation o
    ON o.id = p.organisationid
 GROUP
    BY c.id
     , c.name
 ORDER
    BY c.id
     , c.name

关于MySQL:如何选择和处理 "n to n"相关数据以提高性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41572291/

相关文章:

MySQL 选择最大日期和最大时间的位置

c# - 如何连接MySQL数据库?

mysql - 将表格扁平化为包含 SQL (MySQL) 详细信息的摘要报告

sql - 如何在 PostgreSQL 中删除具有外键的多个表?

php - 使用 php 从 sql 数据库下载后,我得到一个空的 excel 文件

java - 将 python 与更快的语言混合以在 GAE 中进行优化

mysql - 我应该批量获取mysql数据,还是尽可能少地获取数据?

mysql - 根据跨多行的约束选择行

performance - 了解为什么ASM fsqrt实现比标准sqrt函数更快

mysql - 我无法将外键指向日期时间字段类型