MySQL 索引 - 如何提高性能?

标签 mysql indexing multiple-columns

我正在尝试提高现有 MySQL 数据库的性能。

这是一个关于餐馆的数据库,有两个相关的表:

有一个网站所有实体的表,每个实体都有一个唯一的ID, 一个实体几乎可以是任何东西,它可以是一家餐馆、一个用户和许多其他东西。 有多种实体类型,对于餐馆来说,它们的实体类型是“对象”。

我还要说的是,这种数据库结构几乎是现有的 所以我不想做大的改变,我不会删除所有实体的表 例如。 (数据库本身没有数据,但是构建了 PHP 引擎,所以它会 很难对结构进行大的改变)。

还有一个只针对对象的表,有几种类型 该数据库中的对象,但具体来说餐馆将是 搜索很多,因为这是网站的主题, 餐厅有几个字段:国家、城市、名称、流派。 同一个城市同一个国家不可能有两家同名的餐厅, (例如,可以有两家同名但位于不同城市的餐厅 同一国家或两个同名但位于不同国家的城市)

因此,从这个事实来看,我想我应该为国家/地区、城市和名称列创建一个唯一的三列索引。

另外我想说的是,URL也是以www.domain.com/Country/City/Restuarant-Name的形式构建的,所以国家/城市名称的组合应该可以快速获取,并且这种类型的查询将会发生很多事情。

但也会有很多其他类型的查询,例如:搜索名称 一家餐厅(使用 LIKE 查询,因为搜索的名称可能是餐厅的一部分 全名)在某个城市或某个国家。 搜索特定国家和城市特定类型的所有餐厅。 以及几乎所有可能的组合。

最常用的查询可能是 (a) 搜索某个城市的餐厅名称 和国家(这将与键入 URL 时使用的查询相同,但将使用 LIKE),(b)在某个城市和国家搜索某种类型的餐馆。 最后(c)在全局范围内搜索餐厅名称(在整个数据库中,不指定城市和国家)

该表(对象表)当前的主键是对象的 ID, ID 也经常使用,最佳实践如下?:

  1. 根据国家、城市、名称创建一个三列 UNIQUE 索引
  2. 从名称中创建另一个(非唯一)索引(因此我编写了一个类型为 c 的查询 以上将快速执行)
  3. 也许可以制作某种只包含对象中的餐馆的子表 表,因此将查询该子表。 (这不太重要,因为如果我决定 为了做出重大改变,我可能会将餐厅与对象的其余部分分开 首先)

我真的很感激任何帮助,因为我长期以来一直在尝试做出这个决定。

对象表中的一些对象不会有任何流派或任何国家或城市, 所以它们将保持 NULL,我知道 UNIQUE KEY 中允许 NULL 值,但它会吗 对性能有影响吗?

非常感谢任何愿意阅读这个长问题的人:)

最佳答案

您可以根据需要思考和计划,但在尝试、基准测试和比较您的选择之前,您无法确定什么是最好的。也就是说,听起来您确实走在正确的轨道上。

复合键
您的“国家/地区-城市-名称”复合键似乎采用最有用的顺序,因为它是从最广泛到最狭窄的选择标准排序的。我确信您是故意这样做的,因为复合键的值只能从左到右使用。由于 name 在该索引中并不排在第一位,因此您需要一个单独的键来存储 name,正如您所指出的。

索引值 NULL
根据imysql.cn ,“在索引中允许 NULL 值确实不会影响性能。”这只是旁白,没有数据或引用,所以我不知道他们如何/是否证明了这一点。

拆分表格
当然,如果餐馆记录中混杂了很多其他数据,这可能会减慢速度。如果你shard将表拆分为结构相同的“餐厅”和“其他”表,如果需要,您仍然可以使用简单的 UNION 轻松查询它们的组合数据。除非您了解预期的数据/减速情况,否则除非必要,否则我宁愿避免对表进行分片,至少是为了简单性/统一性。

是否存在当前索引无法解释的任何可预见的查询,例如没有国家/地区的城市?如果是这样,请务必适当索引以涵盖所有可预见的情况。您没有提及,但我假设您还会有一个关于流派的索引。

<小时/>

最终,您需要生成大量测试数据并进行尝试。(确定您最终可以期望多少数据,并生成至少三倍的测试数据数据来让系统通过其步伐。)根据您的描述,设计听起来相当不错,但测试可能会发现意想不到的问题,您可以从不同索引中受益的地方等。如果发现任何问题,您会有一个具体的目标要实现,而不是简单地思考所有假设场景。

关于MySQL 索引 - 如何提高性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6388830/

相关文章:

mysql - 数据库查询所需结果

php - 使用 HTML 表单选择和 php 文本输入搜索数据库

php - 在查询中使用 SUM 获取 Json 时出错

python - 在 Pandas 的多级索引上使用 cumsum 方法

mysql - 什么时候应该使用复合索引?

search - Solr 1.4 和 EdgeNGrams 的奇怪结果 - 有些子串匹配,有些不匹配

jquery - Win8 应用程序中灵活的网格和多列

r - 对两列进行排序,有条件地选择值,然后运行 ​​cumsum frequency

python - 删除 pandas 中值不增加的列

php - 如何防止 MySQL 数值发生变化? (phpMyAdmin)