我有 5 个表 table1 - table5,行数不断增加。
Table1 have about 1000 rows
Table2 - 10,000 rows
Table3 - 50,000 rows
Table4 - 100,000 rows
and Table5 - 10,00,000 rows
我想选择包含 account_number 的行,该行可能位于任何表中。
我对搜索 account_number Table1、Table2、...Table5 的最佳方式感到困惑? 或表 5、表 4、...表 1。 请提出建议。
注意:随着时间的推移,这些表格预计会增加最多 40 个数量级。这意味着 Table5 预计一年后将保存大约 4,00,00,000
行,因此我从一开始就非常小心,并且希望搜索的内容不超过所需的数量。
最佳答案
一个表只有一百万行,并且具有所需的索引和收集最新统计数据,这应该不成问题。
收集表统计信息,
EXEC DBMS_STATS.gather_table_stats('SCHEMA_NAME', 'TABLE_NAME');
与最大的 table 相比,其他 table 要小得多。扫描具有1000行的表需要一些毫秒?好吧,一两秒?没事。
很少有事情绝对取决于它是什么样的环境。 OLAP 或 OLTP。但是,我们讨论的是最多 100 万行。它应该足够快。
将索引添加到帐号列,因为您将在过滤谓词中使用它,并检查解释计划 在执行查询之前。
如果你知道获得表 5 中的行的概率高达 95%,那么就从表 5 开始。如果你找到了该行,那就非常好而且幸运了。否则,您将剩下小得多的 table 。
让我们看一个实际的例子:
设置一个包含 9,999,999 行的大表
SQL> create table big_table
2 as
3 select rownum id,
4 OWNER, OBJECT_NAME, SUBOBJECT_NAME,
5 OBJECT_ID, DATA_OBJECT_ID,
6 OBJECT_TYPE, CREATED, LAST_DDL_TIME,
7 TIMESTAMP, STATUS, TEMPORARY,
8 GENERATED, SECONDARY
9 from all_objects a
10 where 1=0
11 /
Table created.
SQL> alter table big_table nologging;
Table altered.
SQL>
SQL> declare
2 l_cnt number;
3 l_rows number := 9999999;
4 begin
5 insert /*+ append */
6 into big_table
7 select rownum,
8 OWNER, OBJECT_NAME, SUBOBJECT_NAME,
9 OBJECT_ID, DATA_OBJECT_ID,
10 OBJECT_TYPE, CREATED, LAST_DDL_TIME,
11 TIMESTAMP, STATUS, TEMPORARY,
12 GENERATED, SECONDARY
13 FROM all_objects A
14 where rownum <= 9999999;
15
16 l_cnt := sql%rowcount;
17
18 commit;
19
20 while (l_cnt < l_rows)
21 loop
22 insert /*+ APPEND */ into big_table
23 select rownum+l_cnt,
24 OWNER, OBJECT_NAME, SUBOBJECT_NAME,
25 OBJECT_ID, DATA_OBJECT_ID,
26 OBJECT_TYPE, CREATED, LAST_DDL_TIME,
27 TIMESTAMP, STATUS, TEMPORARY,
28 GENERATED, SECONDARY
29 from big_table
30 where rownum <= l_rows-l_cnt;
31 l_cnt := l_cnt + sql%rowcount;
32 commit;
33 end loop;
34 end;
35 /
PL/SQL procedure successfully completed.
SQL>
现在我有一个大表,其中包含9,999,999行:
SQL> SET TIME ON timing ON
11:36:54 SQL>
11:36:54 SQL> SELECT COUNT(*) FROM big_table;
COUNT(*)
----------
9999999
Elapsed: 00:00:01.82
11:36:56 SQL>
创建所需索引
11:36:56 SQL> CREATE INDEX big_indx ON big_table(object_name);
Index created.
Elapsed: 00:00:31.31
11:37:27 SQL>
我在 object_name
上创建了一个索引,这花了大约 30 秒
。为了安全起见,我在新创建的表上收集了统计信息:
11:37:27 SQL> EXEC DBMS_STATS.gather_table_stats('LALIT', 'BIG_TABLE');
PL/SQL procedure successfully completed.
Elapsed: 00:00:15.92
11:37:43 SQL>
让我们检查一下解释计划:
11:40:16 SQL> EXPLAIN PLAN FOR
11:40:22 2 SELECT DISTINCT OWNER, OBJECT_NAME FROM big_table WHERE OBJECT_NAME='BIG_TABLE';
Explained.
Elapsed: 00:00:00.00
11:40:26 SQL> SELECT * FROM TABLE(DBMS_XPLAN.DISPLAY);
PLAN_TABLE_OUTPUT
----------------------------------------------------------------------------------------------------
Plan hash value: 1170786741
--------------------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 23 | 713 | 128 (0)| 00:00:01 |
| 1 | HASH UNIQUE | | 23 | 713 | 128 (0)| 00:00:01 |
| 2 | TABLE ACCESS BY INDEX ROWID BATCHED| BIG_TABLE | 194 | 6014 | 128 (0)| 00:00:01 |
|* 3 | INDEX RANGE SCAN | BIG_INDX | 194 | | 4 (0)| 00:00:01 |
--------------------------------------------------------------------------------------------------
PLAN_TABLE_OUTPUT
----------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
3 - access("OBJECT_NAME"='BIG_TABLE')
15 rows selected.
Elapsed: 00:00:00.06
11:40:37 SQL>
所以,解释计划看起来不错。我看到索引范围扫描。所以,我的索引正在被使用,这是一个好消息。
现在,让我们看看搜索我感兴趣的行需要多长时间:
11:42:41 SQL> SELECT DISTINCT OWNER, OBJECT_NAME FROM big_table WHERE OBJECT_NAME='BIG_TABLE';
OWNER OBJECT_NAME
----- ---------------
LALIT BIG_TABLE
Elapsed: 00:00:00.01
11:43:05 SQL>
我们看到了什么?甚至只用了不到一秒。
关于sql - 搜索多个表的顺序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29839406/