mysql - 如何查询实际的 Mysql 数据库大小?

标签 mysql sql optimization

我有一个很大的 sql 表,大约 30 GB,我已经删除了大约一半。所以 information_schema 没有保存正确的信息(直到数据库优化)。 有没有办法获得实际尺寸?使用全表扫描?

最佳答案

使用 InnoDB,许多数字都相当模糊。单行的大小实在是拿不出来。 SHOW TABLE STATUS(以及对 information_schema 的等效探索)为您提供估计。但该估计值可能有很大偏差——有时超过 2 倍,无论高低。

这里是 InnoDB 表布局的简要概述。

数据存储在 16KB block 的 BTree 中,按 PRIMARY KEY 排序。 (我不会讨论其他 B 树中的二级索引。)

在这样的结构中插入一行可能会在所需的 block 中找到空间,或者可能需要进行 block 拆分。删除一行可能会将 block 的一部分标记为空闲,并且可以(很少)将 block 返回到“空闲空间”。

“avg_row_length”的计算方法是磁盘空间减去“空闲” block ,然后除以行数。

但这会得出另一个模糊的数字。行数是通过对 BTree 进行一些探测以查看每个 block 有多少行,然后进行一些计算来估算的。

那么行长度就是模糊磁盘空间(不考虑每个 block 中的空白空间)除以模糊行数。

我提到了“Data_free”。但请注意,插入/删除一行,当它不改变 block 数时,不会改变 Data_free。

TEXT 列(有一些注意事项、限定条件和异常(exception)情况)存储在单独的 block 中。分配单元有16KB block 。因此,如果您有任何 TEXTBLOB 列,计算就会变得非常困惑。

但我还没有完成……小表被分配了几个 16KB 的 block ,但是当它们变得更“小”时,一次分配了 8MB 的空间。同样,其中一些可以在 Data_free 中看到;很多不能。

“免费”空间分为 3 类:

  • 在“Data_free”中可见,但未释放到操作系统。
  • block 中的可重用空间,如 UPDATEsINSERTs 发生。
  • 无形的开销。通过计算每行中每列的长度,将表格的空间规划为您的 2-3 倍。

抱歉,您遇到了不精确的数字。

改变主题...为什么要进行大删除?如果您有一个滑动时间尺度(想想:新闻),PARTITIONs 非常好。如果您要替换所有数据,就会想到 RENAME TABLE 技巧。

关于mysql - 如何查询实际的 Mysql 数据库大小?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40364450/

相关文章:

c# - 消息错误 : System. InvalidCastException:指定的转换无效 10

php - 如何在 JOIN 语句中使用 CASE 根据条件连接两个表?

PHP set Hash 与 Swift 应用程序的 Checked hash 不同

mysql - 在一个查询中更新/增加多个 MySQL 列

Java集合: checking object property

mysql - 总和数据库中特定列的所有行是相同的

mysql - 通过保留表中的最小行来删除重复记录

MySQL:在列列表中使用 COUNT(column_name),并在 HAVING 子句中再次使用。这是否会导致 COUNT(column_name) 操作运行两次?

python - 尽可能快的类字典匹配

php - 使用索引改进 MySQL 表