我正在尝试提高现有 MySQL 数据库的性能。
这是一个关于餐馆的数据库,有两个相关的表:
有一个网站所有实体的表,每个实体都有一个唯一的ID, 一个实体几乎可以是任何东西,它可以是一家餐馆、一个用户和许多其他东西。 有多种实体类型,对于餐馆来说,它们的实体类型是“对象”。
我还要说的是,这种数据库结构几乎是现有的 所以我不想做大的改变,我不会删除所有实体的表 例如。 (数据库本身没有数据,但是构建了 PHP 引擎,所以它会 很难对结构进行大的改变)。
还有一个只针对对象的表,有几种类型 该数据库中的对象,但具体来说餐馆将是 搜索很多,因为这是网站的主题, 餐厅有几个字段:国家、城市、名称、流派。 同一个城市同一个国家不可能有两家同名的餐厅, (例如,可以有两家同名但位于不同城市的餐厅 同一国家或两个同名但位于不同国家的城市)
因此,从这个事实来看,我想我应该为国家/地区、城市和名称列创建一个唯一的三列索引。
另外我想说的是,URL也是以www.domain.com/Country/City/Restuarant-Name的形式构建的,所以国家/城市名称的组合应该可以快速获取,并且这种类型的查询将会发生很多事情。
但也会有很多其他类型的查询,例如:搜索名称 一家餐厅(使用 LIKE 查询,因为搜索的名称可能是餐厅的一部分 全名)在某个城市或某个国家。 搜索特定国家和城市特定类型的所有餐厅。 以及几乎所有可能的组合。
最常用的查询可能是 (a) 搜索某个城市的餐厅名称 和国家(这将与键入 URL 时使用的查询相同,但将使用 LIKE),(b)在某个城市和国家搜索某种类型的餐馆。 最后(c)在全局范围内搜索餐厅名称(在整个数据库中,不指定城市和国家)
该表(对象表)当前的主键是对象的 ID, ID 也经常使用,最佳实践如下?:
- 根据国家、城市、名称创建一个三列 UNIQUE 索引
- 从名称中创建另一个(非唯一)索引(因此我编写了一个类型为 c 的查询 以上将快速执行)
- 也许可以制作某种只包含对象中的餐馆的子表 表,因此将查询该子表。 (这不太重要,因为如果我决定 为了做出重大改变,我可能会将餐厅与对象的其余部分分开 首先)
我真的很感激任何帮助,因为我长期以来一直在尝试做出这个决定。
对象表中的一些对象不会有任何流派或任何国家或城市, 所以它们将保持 NULL,我知道 UNIQUE KEY 中允许 NULL 值,但它会吗 对性能有影响吗?
非常感谢任何愿意阅读这个长问题的人:)
最佳答案
您可以根据需要思考和计划,但在尝试、基准测试和比较您的选择之前,您无法确定什么是最好的。也就是说,听起来您确实走在正确的轨道上。
复合键
您的“国家/地区-城市-名称”复合键似乎采用最有用的顺序,因为它是从最广泛到最狭窄的选择标准排序的。我确信您是故意这样做的,因为复合键的值只能从左到右使用。由于 name 在该索引中并不排在第一位,因此您需要一个单独的键来存储 name,正如您所指出的。
索引值 NULL
根据imysql.cn ,“在索引中允许 NULL 值确实不会影响性能。”这只是旁白,没有数据或引用,所以我不知道他们如何/是否证明了这一点。
拆分表格
当然,如果餐馆记录中混杂了很多其他数据,这可能会减慢速度。如果你shard将表拆分为结构相同的“餐厅”和“其他”表,如果需要,您仍然可以使用简单的 UNION 轻松查询它们的组合数据。除非您了解预期的数据/减速情况,否则除非必要,否则我宁愿避免对表进行分片,至少是为了简单性/统一性。
是否存在当前索引无法解释的任何可预见的查询,例如没有国家/地区的城市?如果是这样,请务必适当索引以涵盖所有可预见的情况。您没有提及,但我假设您还会有一个关于流派的索引。
<小时/>最终,您需要生成大量测试数据并进行尝试。(确定您最终可以期望多少数据,并生成至少三倍的测试数据数据来让系统通过其步伐。)根据您的描述,设计听起来相当不错,但测试可能会发现意想不到的问题,您可以从不同索引中受益的地方等。如果发现任何问题,您会有一个具体的目标要实现,而不是简单地思考所有假设场景。
关于MySQL 索引 - 如何提高性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6388830/