sql - 搜索多个表的顺序

标签 sql oracle search select query-performance

我有 5 个表 table1 - table5,行数不断增加。

Table1 have about 1000 rows
Table2 - 10,000 rows 
Table3 - 50,000 rows
Table4 - 100,000 rows
and Table5 - 10,00,000 rows

我想选择包含 account_number 的行,该行可能位于任何表中。

我对搜索 account_number Table1、Table2、...Table5 的最佳方式感到困惑? 或表 5、表 4、...表 1。 请提出建议。

注意:随着时间的推移,这些表格预计会增加最多 40 个数量级。这意味着 Table5 预计一年后将保存大约 4,00,00,000 行,因此我从一开始就非常小心,并且希望搜索的内容不超过所需的数量。

最佳答案

一个表只有一百万行,并且具有所需的索引收集最新统计数据,这应该不成问题。

收集表统计信息

EXEC DBMS_STATS.gather_table_stats('SCHEMA_NAME', 'TABLE_NAME');

与最大的 table 相比,其他 table 要小得多。扫描具有1000行的表需要一些毫秒?好吧,一两秒?没事。

很少有事情绝对取决于它是什么样的环境。 OLAP 或 OLTP。但是,我们讨论的是最多 100 万行。它应该足够快。

索引添加到帐号列,因为您将在过滤谓词中使用它,并检查解释计划 在执行查询之前。

如果你知道获得表 5 中的行的概率高达 95%,那么就从表 5 开始。如果你找到了该行,那就非常好而且幸运了。否则,您将剩下小得多的 table 。

让我们看一个实际的例子:

设置一个包含 9,999,999 行的大表

SQL> create table big_table
  2  as
  3  select rownum id,
  4                 OWNER, OBJECT_NAME, SUBOBJECT_NAME,
  5                 OBJECT_ID, DATA_OBJECT_ID,
  6                 OBJECT_TYPE, CREATED, LAST_DDL_TIME,
  7                 TIMESTAMP, STATUS, TEMPORARY,
  8                 GENERATED, SECONDARY
  9    from all_objects a
 10   where 1=0
 11  /

Table created.

SQL> alter table big_table nologging;

Table altered.

SQL>
SQL> declare
  2      l_cnt number;
  3      l_rows number := 9999999;
  4  begin
  5      insert /*+ append */
  6      into big_table
  7      select rownum,
  8                 OWNER, OBJECT_NAME, SUBOBJECT_NAME,
  9                 OBJECT_ID, DATA_OBJECT_ID,
 10                 OBJECT_TYPE, CREATED, LAST_DDL_TIME,
 11                 TIMESTAMP, STATUS, TEMPORARY,
 12                 GENERATED, SECONDARY
 13        FROM all_objects A
 14       where rownum <= 9999999;
 15
 16      l_cnt := sql%rowcount;
 17
 18      commit;
 19
 20      while (l_cnt < l_rows)
 21      loop
 22          insert /*+ APPEND */ into big_table
 23          select rownum+l_cnt,
 24                 OWNER, OBJECT_NAME, SUBOBJECT_NAME,
 25                 OBJECT_ID, DATA_OBJECT_ID,
 26                 OBJECT_TYPE, CREATED, LAST_DDL_TIME,
 27                 TIMESTAMP, STATUS, TEMPORARY,
 28                 GENERATED, SECONDARY
 29            from big_table
 30           where rownum <= l_rows-l_cnt;
 31          l_cnt := l_cnt + sql%rowcount;
 32          commit;
 33      end loop;
 34  end;
 35  /

PL/SQL procedure successfully completed.

SQL>

现在我有一个大表,其中包含9,999,999行:

SQL> SET TIME ON timing ON
11:36:54 SQL>
11:36:54 SQL> SELECT COUNT(*) FROM big_table;

  COUNT(*)
----------
   9999999

Elapsed: 00:00:01.82
11:36:56 SQL>

创建所需索引

11:36:56 SQL> CREATE INDEX big_indx ON big_table(object_name);

Index created.

Elapsed: 00:00:31.31
11:37:27 SQL>

我在 object_name 上创建了一个索引,这花了大约 30 秒。为了安全起见,我在新创建的表上收集了统计信息:

11:37:27 SQL> EXEC DBMS_STATS.gather_table_stats('LALIT', 'BIG_TABLE');

PL/SQL procedure successfully completed.

Elapsed: 00:00:15.92
11:37:43 SQL>

让我们检查一下解释计划:

11:40:16 SQL> EXPLAIN PLAN FOR
11:40:22   2  SELECT DISTINCT OWNER, OBJECT_NAME FROM big_table WHERE OBJECT_NAME='BIG_TABLE';

Explained.

Elapsed: 00:00:00.00
11:40:26 SQL> SELECT * FROM TABLE(DBMS_XPLAN.DISPLAY);

PLAN_TABLE_OUTPUT
----------------------------------------------------------------------------------------------------
Plan hash value: 1170786741

--------------------------------------------------------------------------------------------------
| Id  | Operation                            | Name      | Rows  | Bytes | Cost (%CPU)| Time     |
--------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT                     |           |    23 |   713 |   128   (0)| 00:00:01 |
|   1 |  HASH UNIQUE                         |           |    23 |   713 |   128   (0)| 00:00:01 |
|   2 |   TABLE ACCESS BY INDEX ROWID BATCHED| BIG_TABLE |   194 |  6014 |   128   (0)| 00:00:01 |
|*  3 |    INDEX RANGE SCAN                  | BIG_INDX  |   194 |       |     4   (0)| 00:00:01 |
--------------------------------------------------------------------------------------------------


PLAN_TABLE_OUTPUT
----------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------

   3 - access("OBJECT_NAME"='BIG_TABLE')

15 rows selected.

Elapsed: 00:00:00.06
11:40:37 SQL>

所以,解释计划看起来不错。我看到索引范围扫描。所以,我的索引正在被使用,这是一个好消息。

现在,让我们看看搜索我感兴趣的行需要多长时间:

11:42:41 SQL> SELECT DISTINCT OWNER, OBJECT_NAME FROM big_table WHERE OBJECT_NAME='BIG_TABLE';

OWNER OBJECT_NAME
----- ---------------
LALIT BIG_TABLE

Elapsed: 00:00:00.01
11:43:05 SQL>

我们看到了什么?甚至只用了不到一秒

关于sql - 搜索多个表的顺序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29839406/

相关文章:

mysql - MySQL 中何时使用单引号、双引号和反引号

SQL 自然连接,vs join on,vs where

java.lang.IllegalArgumentException : SQL array must not be empty

search - k-d树对kNN搜索有效。 k最近邻居搜索

mysql - 对所有类型的字段进行全文搜索是一个好习惯吗?

mysql - 如何在 SQL 中请求随机 3 行?

java - hibernate hql - 执行更新查询后返回更新的行ID列表

oracle - 向不同模式的用户授予权限

c# - 搜索 C# 代码以查找未接来电

c# - 在 LINQ 查询中调用 SQL 用户定义的函数