sql - 单表与联合双结构的性能

标签 sql database linq performance structure

这不是关于使用其他工具的问题。这不是关于使用不同数据结构的问题。这是关于为什么我看到我看到的问题 - 请在回答之前阅读到最后。谢谢。

故事

我有一个表有一个条件,记录没有被删除。相反,记录被标记为不活动(有相应的字段),在这种情况下,所有字段(标识符和这个 isActive 字段除外)都被认为是不相关的。

关于标识符的更多信息——有两个字段:

  • id -- int,主键,集群
  • 名称 -- 唯一、varchar、外部索引

例如更新是如何完成的(我使用C#/Linq/MSSQL2005):我根据名称获取记录,然后更改必填字段并提交更改,因此执行更新(UPDATE使用id,而不是名称) .

但是存储有问题。那么为什么不将该表分解为双重结构——“头”表(id、名称、isActive)和数据表(id、其余字段)。如果存储出现问题,我们可以从数据表中删除所有记录(对于 isActive=false)。

编辑(通过 Shimmy):LINQ 不会通过连接检索 header +数据。数据记录按需加载(这总是因为代码而发生)。

评论(来自海报):AFAIR 没有加入,所以这是无关紧要的。标题数据是手动加载的。见下文。

性能——(我的)理论

现在,性能如何?哪个会更快?假设您在两个表(单个、标题、数据)中都有 10000 条记录,并且您一个一个地更新它们(所有 3 个表)——字段 isActive 和“数据”字段中的一些字段。

我的计算是/是:

  • mono table -- 使用外部索引搜索,然后跳转到结构中,获取所有数据,使用主键更新。

  • 双表--使用外部索引查找,跳转到头表,取出所有数据,在数据表上使用主键查找(这里没有跳转,是聚簇索引),取出所有数据,更新两个表都使用主键。

所以,对我来说单结构应该更快,因为在双结构中我有相同的操作加上一些额外的东西。

结果

无论我做什么,更新、选择、插入,双结构要么稍好(速度)要么快 30%。现在我很困惑——我会理解如果我只插入/更新/选择标题记录,但在每种情况下数据记录都会被使用。

问题 -- 为什么/如何双结构可以更快?

最佳答案

我认为这一切都归结为正在获取、插入和更新的数据量。

SELECT 案例 - 在双表配置中,您获取的数据较少。数据库运行时在很大程度上受 I/O 时间支配,因此在单表配置的每一行上复制“标题”字段意味着您必须一遍又一遍地读取相同的数据。在双表配置中,您只读取一次 header 数据。

INSERT case - 与上面类似,但与写入数据而不是读取数据有关。

UPDATE 案例 - 您的代码更新了“isActive”字段,如果我没看错的话,它是“header”字段的一部分。在单表配置中,您强制为每个“isActive”更改更新许多行。在双表配置中,您仅为每个“isActive”更改更新单个标题行。

我认为这是一个过早优化的案例。我感觉您理解根据数据规范化规则,双表配置“更好”——但因为单表情况似乎会提供更好的性能,您希望采用该设计。值得庆幸的是,您花时间测试了会发生什么,并发现观察到的性能与您的预期不符。 干得好!我希望更多的人能花时间像这样测试一下。我认为这里要吸取的教训是数据规范化是一件好事。

请记住,优化某些东西的最佳时机是永远!优化事物的次佳时机是当您观察到性能问题时最差的优化时间是在分析期间。

希望对您有所帮助。

关于sql - 单表与联合双结构的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2198272/

相关文章:

php - 为 CodeIgniter 生成安装脚本

sql - 数据库中的对象模型是什么?

mysql - 一行的多列值的总和

c# - 是否可以让 Entity Framework 识别已创建但尚未保存在数据库中的对象?

c# - 从 id 属性获取 xml 节点值 C#

php - PHP、PDO(可能不是 MySQL)的神秘之处 SQLSTATE[42000](1064)

sql - 如何: Schedule a Job (Stored Procedure/Trigger)

sql - C# 访问和显示表中数据的方法

database - 如何在 Postgres 8.2 中打开 SQL 日志记录?

c# - select r.Field 和 select new {r.Field} 的区别