mysql - 联接表中全文搜索的性能

标签 mysql performance join full-text-search

我有三个表:

CREATE TABLE `dp_organisation` (
  `OrganisationId` bigint(32) NOT NULL AUTO_INCREMENT,
  `Name` text COLLATE utf8mb4_unicode_ci NOT NULL,
  `ShortName` text COLLATE utf8mb4_unicode_ci,
  PRIMARY KEY (`OrganisationId`),
  FULLTEXT KEY `fulltext` (`Name`,`ShortName`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

CREATE TABLE `dp_organisation_member` (
  `OrganisationId` bigint(32) NOT NULL,
  `UserId` bigint(32) NOT NULL,
  PRIMARY KEY (`OrganisationId`,`UserId`),
  UNIQUE KEY `UserId` (`UserId`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

CREATE TABLE `dp_user` (
  `UserId` bigint(32) NOT NULL AUTO_INCREMENT,
  `Alias` varchar(125) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
  `Firstname` text COLLATE utf8mb4_unicode_ci NOT NULL,
  `Surname` text COLLATE utf8mb4_unicode_ci,
  `Email` varchar(125) COLLATE utf8mb4_unicode_ci NOT NULL,
  PRIMARY KEY (`UserId`),
  FULLTEXT KEY `fulltext` (`Alias`,`Firstname`,`Surname`,`Email`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

dp_organisation 包含所有组织,而 dp_users 包含所有用户。 dp_organisation_member 是用户和组织之间的关系。每个用户最多是一个组织的成员。

现在我想搜索匹配某个字符串的用户。我想在搜索时同时检查用户的信息和用户的组织信息,所以应该使用 dp_usersdp_organisation 上的全文索引。我创建了以下查询来实现此目的:

SELECT *
FROM dp_user u
LEFT JOIN dp_organisation_member m ON m.`UserId` = u.`UserId`
LEFT JOIN dp_organisation o ON o.`OrganisationId` = m.`OrganisationId`
WHERE MATCH(u.`Alias`, u.`Firstname`, u.`Surname`, u.`Email`) AGAINST ('foo')
OR MATCH(o.`Name`, o.`ShortName`) AGAINST ('foo')

但是查询执行得非常糟糕。只是为了测试,我尝试了以下,它只搜索用户的信息:

SELECT *
FROM dp_user u
LEFT JOIN dp_organisation_member m ON m.`UserId` = u.`UserId`
LEFT JOIN dp_organisation o ON o.`OrganisationId` = m.`OrganisationId`
WHERE MATCH(u.`Alias`, u.`Firstname`, u.`Surname`, u.`Email`) AGAINST ('foo')

它的运行速度提高了大约 30 倍。

如果我只搜索组织的信息:

SELECT *
FROM dp_user u
LEFT JOIN dp_organisation_member m ON m.`UserId` = u.`UserId`
LEFT JOIN dp_organisation o ON o.`OrganisationId` = m.`OrganisationId`
WHERE MATCH(o.`Name`, o.`ShortName`) AGAINST ('foo')

查询又变慢了。

为了检查 dp_organisation 中的全文索引没有问题,我反转了从 dp_organisation 中选择并加入 dp_user 的查询:

SELECT *
FROM dp_organisation o
LEFT JOIN dp_organisation_member m ON m.`OrganisationId` = o.`OrganisationId`
LEFT JOIN dp_user u ON u.`UserId` = m.`UserId`
WHERE MATCH(u.`Alias`, u.`Firstname`, u.`Surname`, u.`Email`) AGAINST ('foo')
OR MATCH(o.`Name`, o.`ShortName`) AGAINST ('foo')

上面的查询速度很慢,只在用户信息中搜索也是如此:

SELECT *
FROM dp_organisation o
LEFT JOIN dp_organisation_member m ON m.`OrganisationId` = o.`OrganisationId`
LEFT JOIN dp_user u ON u.`UserId` = m.`UserId`
WHERE MATCH(u.`Alias`, u.`Firstname`, u.`Surname`, u.`Email`) AGAINST ('foo')

然而,仅在组织信息中搜索的查询速度很快(大约快 25 倍):

SELECT *
FROM dp_organisation o
LEFT JOIN dp_organisation_member m ON m.`OrganisationId` = o.`OrganisationId`
LEFT JOIN dp_user u ON u.`UserId` = m.`UserId`
WHERE MATCH(o.`Name`, o.`ShortName`) AGAINST ('foo')

所以看起来我只有在主表中进行全文搜索时才能获得良好的性能,而不是在连接到该表中的那些。在联接表中进行全文搜索时,如何才能获得良好的性能?

最佳答案

在查询中结合 FTS 和 JOIN 会导致速度变慢,因为 mysql 通常每个表只使用一个索引。当您对一个表执行 FTS 时,mysql 对该表使用全文索引,因此不可能使用索引进行连接。

在其他新闻中,dp_organisation_member 表上的索引没有多大意义。您已将 user_id 字段设为唯一。这意味着一个用户只能属于一个组织,这实际上意味着 dp_organisation_member 表是多余的。你已经过度规范化了。您可以删除此表并将组织 ID 添加到 dp_user 并删除您的一个连接。

关于mysql - 联接表中全文搜索的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40528187/

相关文章:

php - 成功调用后访问jquery函数?

android - Google Analytics 会影响 Android 的性能吗?

java - 通过局部变量访问 volatile 字段

c++ - http ://tinyurl. com/pzpyvb9 处的无锁堆栈的性能数据是否真实?

sql - Hive 查询 : select a column based on the condition another columns values match some specific values, 然后将匹配结果创建为新列

mysql - 使用 mySQL JOIN CASE 选择 "friends"

mysql - UTC 数据库中 IST 数据按小时求和值

mysql - 尝试从 spring mvc 应用程序在 mysql 中插入数据时获取 java.io.EOFException

javascript - 需要测验应用程序一次只显示一个项目

mysql - 连接从同一个表创建的两个子查询