MySQL 匹配同一表中的列

好的，一点入门知识；我是一名专业的 PHP/JS/C 开发人员，但从未完全掌握 MySQL。如果您能回答我的问题，那就太好了，但如果您能为我指明好的资源的方向，以了解复杂的 MySQL 查询该做什么和不该做什么(主要是从效率的角度来看)，那也同样有帮助)。

目标

我需要在单个表中查找相似性/重叠，同时仍然提取整个结果集(与另一个表中的实际标题/描述内容进行 LEFT JOIN)。

表格极其简单；它包含 3 列(页面、用户、时间)。

基本上每个查询都会有两个用户。我需要提取与 User 1 匹配的所有结果的计数、与 User 2 匹配的所有结果的计数，以及重叠的所有列(加上 LEFT JOIN)(其中 用户 1 和用户 2 在表中有匹配项。

示例查询

这个查询可以工作，但是它非常慢(需要几分钟才能运行)并且我猜测由于子查询而效率低下。如果任何 SQL 专家能够指出一种更有效的方法来做到这一点(以及原因)，我们将不胜感激。

SELECT DISTINCT `page`, 
    (SELECT COUNT(*) FROM `m_likes` WHERE `user` = "1") AS userLikes,
    (SELECT COUNT(*) FROM `m_likes` WHERE `user` = "2") AS friendLikes

    FROM `m_likes` LEFT JOIN `app_pages` AS page ON (page.id = `page`)

        WHERE `page` IN (SELECT `page` FROM `m_likes` WHERE `user` = "1") 
        AND `page` IN (SELECT `page` FROM `m_likes` WHERE `user` = "2")

        AND (`user` = "1" OR `user` = "2")

解释查询结果

id  select_type table   type    possible_keys   key key_len ref rows    Extra
1   PRIMARY     m_likes index   NULL    page    604 NULL    35043   Using where; Using index; Using temporary
1   PRIMARY     page    eq_ref  PRIMARY PRIMARY 767 tablename.m_likes.page  1   
5   DEPENDENT SUBQUERY  m_likes unique_subquery page    page    604 func,const      1   Using index; Using where
4   DEPENDENT SUBQUERY  m_likes unique_subquery page    page    604 func,const      1   Using index; Using where
3   SUBQUERY    m_likes index   NULL    page    604 NULL    35043   Using where; Using index
2   SUBQUERY    m_likes index   NULL    page    604 NULL    35043   Using where; Using index

表架构

app_pages:id VARCHAR(255)、名称 VARCHAR(255)、类别 VARCHAR(255)

m_likes:页面 VARCHAR(255)、用户 VARCHAR(255)、时间 INT(20)

m_likes.page = app_pages.id

还值得注意的是，不幸的是，用户和页面 ID 必须是 VARCHAR 而不是 INT，因为不能保证在 64 位系统上运行，并且某些 ID 值大于 64 位系统上允许的最大值。 32 位系统...希望这不会对性能造成重大影响。

输出示例

array (size=156)
  0 => 
    array (size=6)
      'page' => string '100861973286778' (length=15)
      'time' => string '1297383617' (length=10)
      'name' => string 'Leila' (length=5)
      'category' => string 'Book' (length=4)
      'userLikes' => string '104' (length=3)
      'friendLikes' => string '52' (length=2)
  1 => 
    array (size=6)
      'page' => string '10150160788195604' (length=17)
      'time' => string '1272653871' (length=10)
      'name' => string 'Frisbee Golfing' (length=15)
      'category' => string 'Interest' (length=8)
      'userLikes' => string '104' (length=3)
      'friendLikes' => string '52' (length=2)

最佳答案

您的查询运行如此缓慢的原因是您正在执行四个个单独的子查询，这些子查询实际上最终针对EACH行执行。

相反，您可以对子选择进行笛卡尔积来获取总计数(仅执行一次):

SELECT a.page, c.userLikes, c.friendLikes
FROM m_likes a
INNER JOIN app_pages b ON a.page = b.id
CROSS JOIN
(
    SELECT
        COUNT(CASE WHEN user = '1' THEN 1 END) AS userLikes,
        COUNT(CASE WHEN user = '2' THEN 1 END) AS friendLikes
    FROM m_likes
    WHERE user IN ('1','2')
) c
WHERE a.user IN ('1','2')
GROUP BY a.page
HAVING COUNT(1) = 2

此查询将检索用户 1 和 2 都喜欢的所有页面，以及他们喜欢的总计数(将在结果集中重复)。

关于MySQL 匹配同一表中的列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11604800/

MySQL 匹配同一表中的列

上一篇：MySQL 日期保留

下一篇：MySQL JOIN + 子查询查询优化