我有三个表:
CREATE TABLE `dp_organisation` (
`OrganisationId` bigint(32) NOT NULL AUTO_INCREMENT,
`Name` text COLLATE utf8mb4_unicode_ci NOT NULL,
`ShortName` text COLLATE utf8mb4_unicode_ci,
PRIMARY KEY (`OrganisationId`),
FULLTEXT KEY `fulltext` (`Name`,`ShortName`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
CREATE TABLE `dp_organisation_member` (
`OrganisationId` bigint(32) NOT NULL,
`UserId` bigint(32) NOT NULL,
PRIMARY KEY (`OrganisationId`,`UserId`),
UNIQUE KEY `UserId` (`UserId`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
CREATE TABLE `dp_user` (
`UserId` bigint(32) NOT NULL AUTO_INCREMENT,
`Alias` varchar(125) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
`Firstname` text COLLATE utf8mb4_unicode_ci NOT NULL,
`Surname` text COLLATE utf8mb4_unicode_ci,
`Email` varchar(125) COLLATE utf8mb4_unicode_ci NOT NULL,
PRIMARY KEY (`UserId`),
FULLTEXT KEY `fulltext` (`Alias`,`Firstname`,`Surname`,`Email`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
dp_organisation
包含所有组织,而 dp_users
包含所有用户。 dp_organisation_member
是用户和组织之间的关系。每个用户最多是一个组织的成员。
现在我想搜索匹配某个字符串的用户。我想在搜索时同时检查用户的信息和用户的组织信息,所以应该使用 dp_users
和 dp_organisation
上的全文索引。我创建了以下查询来实现此目的:
SELECT *
FROM dp_user u
LEFT JOIN dp_organisation_member m ON m.`UserId` = u.`UserId`
LEFT JOIN dp_organisation o ON o.`OrganisationId` = m.`OrganisationId`
WHERE MATCH(u.`Alias`, u.`Firstname`, u.`Surname`, u.`Email`) AGAINST ('foo')
OR MATCH(o.`Name`, o.`ShortName`) AGAINST ('foo')
但是查询执行得非常糟糕。只是为了测试,我尝试了以下,它只搜索用户的信息:
SELECT *
FROM dp_user u
LEFT JOIN dp_organisation_member m ON m.`UserId` = u.`UserId`
LEFT JOIN dp_organisation o ON o.`OrganisationId` = m.`OrganisationId`
WHERE MATCH(u.`Alias`, u.`Firstname`, u.`Surname`, u.`Email`) AGAINST ('foo')
它的运行速度提高了大约 30 倍。
如果我只搜索组织的信息:
SELECT *
FROM dp_user u
LEFT JOIN dp_organisation_member m ON m.`UserId` = u.`UserId`
LEFT JOIN dp_organisation o ON o.`OrganisationId` = m.`OrganisationId`
WHERE MATCH(o.`Name`, o.`ShortName`) AGAINST ('foo')
查询又变慢了。
为了检查 dp_organisation
中的全文索引没有问题,我反转了从 dp_organisation
中选择并加入 dp_user
的查询:
SELECT *
FROM dp_organisation o
LEFT JOIN dp_organisation_member m ON m.`OrganisationId` = o.`OrganisationId`
LEFT JOIN dp_user u ON u.`UserId` = m.`UserId`
WHERE MATCH(u.`Alias`, u.`Firstname`, u.`Surname`, u.`Email`) AGAINST ('foo')
OR MATCH(o.`Name`, o.`ShortName`) AGAINST ('foo')
上面的查询速度很慢,只在用户信息中搜索也是如此:
SELECT *
FROM dp_organisation o
LEFT JOIN dp_organisation_member m ON m.`OrganisationId` = o.`OrganisationId`
LEFT JOIN dp_user u ON u.`UserId` = m.`UserId`
WHERE MATCH(u.`Alias`, u.`Firstname`, u.`Surname`, u.`Email`) AGAINST ('foo')
然而,仅在组织信息中搜索的查询速度很快(大约快 25 倍):
SELECT *
FROM dp_organisation o
LEFT JOIN dp_organisation_member m ON m.`OrganisationId` = o.`OrganisationId`
LEFT JOIN dp_user u ON u.`UserId` = m.`UserId`
WHERE MATCH(o.`Name`, o.`ShortName`) AGAINST ('foo')
所以看起来我只有在主表中进行全文搜索时才能获得良好的性能,而不是在连接到该表中的那些。在联接表中进行全文搜索时,如何才能获得良好的性能?
最佳答案
在查询中结合 FTS 和 JOIN 会导致速度变慢,因为 mysql 通常每个表只使用一个索引。当您对一个表执行 FTS 时,mysql 对该表使用全文索引,因此不可能使用索引进行连接。
在其他新闻中,dp_organisation_member 表上的索引没有多大意义。您已将 user_id
字段设为唯一。这意味着一个用户只能属于一个组织,这实际上意味着 dp_organisation_member 表是多余的。你已经过度规范化了。您可以删除此表并将组织 ID 添加到 dp_user 并删除您的一个连接。
关于mysql - 联接表中全文搜索的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40528187/