使用变量在存在索引的情况下进行 MySQL 排名

标签 mysql sql mariadb

使用 @N=@N + 1 的经典技巧来获取某些有序列上的项目排名。现在在订购之前,我需要通过将它与其他表内部连接来从基表中过滤掉一些值。所以查询看起来像这样 -:

SET @N=0;
SELECT 
  @N := @N + 1 AS rank,
  fa.id,
  fa.val 
FROM
    table1 AS fa 
    INNER JOIN table2 AS em 
      ON em.id = fa.id 
      AND em.type = "A" 
ORDER BY fa.val ;

问题是,如果我在 em.type 上没有索引,那么一切正常,但如果我在 em.type 上放置一个索引,那么就会出现问题,排名值将不再按 val 列排序按照行存储在 em 表中的顺序。

这里是示例输出-:

没有索引:

rank    id         val
1   05F8C7  55050.000000
2   05HJDG  51404.733458
3   05TK1Z  46972.008208
4   05F2TR  46900.000000
5   05F349  44433.412847
6   06C2BT  43750.000000
7   0012X3  42000.000000
8   05MMPK  39430.399658
9   05MLW5  39054.046383
10  062D20  35550.000000

带有索引:

rank      id        val
480     05F8C7  55050.000000
629     05HJDG  51404.733458
1603    05TK1Z  46972.008208
466     05F2TR  46900.000000
467     05F349  44433.412847
3534    06C2BT  43750.000000
15      0012X3  42000.000000
1109    05MMPK  39430.399658
1087    05MLW5  39054.046383
2544    062D20  35550.000000

我相信索引的使用应该是完全透明的,输出不应该受到它的影响。这是 MySQL 中的错误吗?

最佳答案

这个“把戏”是一颗待爆炸的炸弹。一个聪明的优化器会在它认为合适的时候评估查询,优化速度——这就是它被称为优化器的原因。我不认为这种 MySQL 变量的使用被记录为可以像您期望的那样工作,但它确实有效。

一直有效,直到最近对 MariaDB 优化器进行了改进。它可能会在主流 MySQL 中崩溃,因为在(尚未发布,仍为测试版)5.6 版本中对优化器进行了多项改进。

您可以做的(直到 MySQL 实现了窗口函数)是使用自连接和分组。无论 future 在优化器中做了什么改进,结果都将是一致的。缺点是它可能不是很有效:

SELECT 
  COUNT(*) AS rank,
  fa.id,
  fa.val 
FROM
    table1 AS fa 
    INNER JOIN table2 AS em 
      ON em.id = fa.id 
      AND em.type = 'A'

    INNER JOIN

    table1 AS fa2 
    INNER JOIN table2 AS em2 
      ON em2.id = fa2.id 
      AND em2.type = 'A' 

      ON fa2.id <= fa.id 
                          --- assuming that `id` is the Primary Key of the table
GROUP BY fa.id
ORDER BY fa.val ;

关于使用变量在存在索引的情况下进行 MySQL 排名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10856546/

相关文章:

sql - MySql 获取日期值之间的行

mysql - 为什么启用二进制日志记录选项时禁用 SUPER 权限?

sql - 当 deleteOldRevisions 内存不足时如何删除旧的 MediaWiki 修订版

MySQL触发器检查行字段是否存在

mysql - 清空慢查询日志

javascript - D3 条形图故障排除

Mysql计算子查询

php - 在 Mysql 查询中使用分页

sql - 如何在 PostgreSQL 中使用(安装)dblink?

sql - 查询以从每个组中找到第二大值