我有一个很大的 sql 表,大约 30 GB,我已经删除了大约一半。所以 information_schema
没有保存正确的信息(直到数据库优化)。
有没有办法获得实际尺寸?使用全表扫描?
最佳答案
使用 InnoDB,许多数字都相当模糊。单行的大小实在是拿不出来。 SHOW TABLE STATUS
(以及对 information_schema
的等效探索)为您提供估计。但该估计值可能有很大偏差——有时超过 2 倍,无论高低。
这里是 InnoDB 表布局的简要概述。
数据存储在 16KB block 的 BTree 中,按 PRIMARY KEY
排序。 (我不会讨论其他 B 树中的二级索引。)
在这样的结构中插入一行可能会在所需的 block 中找到空间,或者可能需要进行 block 拆分。删除一行可能会将 block 的一部分标记为空闲,并且可以(很少)将 block 返回到“空闲空间”。
“avg_row_length”的计算方法是磁盘空间减去“空闲” block ,然后除以行数。
但这会得出另一个模糊的数字。行数是通过对 BTree 进行一些探测以查看每个 block 有多少行,然后进行一些计算来估算的。
那么行长度就是模糊磁盘空间(不考虑每个 block 中的空白空间)除以模糊行数。
我提到了“Data_free”。但请注意,插入/删除一行,当它不改变 block 数时,不会改变 Data_free。
TEXT
列(有一些注意事项、限定条件和异常(exception)情况)存储在单独的 block 中。分配单元有16KB block 。因此,如果您有任何 TEXT
或 BLOB
列,计算就会变得非常困惑。
但我还没有完成……小表被分配了几个 16KB 的 block ,但是当它们变得更“小”时,一次分配了 8MB 的空间。同样,其中一些可以在 Data_free 中看到;很多不能。
“免费”空间分为 3 类:
- 在“Data_free”中可见,但未释放到操作系统。
- block 中的可重用空间,如
UPDATEs
和INSERTs
发生。 - 无形的开销。通过计算每行中每列的长度,将表格的空间规划为您的 2-3 倍。
抱歉,您遇到了不精确的数字。
改变主题...为什么要进行大删除?如果您有一个滑动时间尺度(想想:新闻),PARTITIONs
非常好。如果您要替换所有数据,就会想到 RENAME TABLE
技巧。
关于mysql - 如何查询实际的 Mysql 数据库大小?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40364450/