sql - 使用 Teradata 限制子查询中的行数

我是 Teradata 新手，我遇到了以前使用的数据库中没有的问题。基本上，我试图减少 where 子句内的子查询中返回的行数。我之前使用 ROWNUM 函数执行此操作没有任何问题。

我之前的查询是这样的:

SELECT * FROM myTable
WHERE field1 = 'foo' AND field2 in(
    SELECT field2 FROM anotherTable
    WHERE field3 = 'bar' AND ROWNUM<100);

由于我无法在 TD 中使用 ROWNUM，因此我一直在寻找等效的函数，或者至少是可以让我到达我想要的位置的函数，即使它们并不完全等效。我找到并尝试了:ROW_NUMBER、TOP 和 SAMPLE。

我尝试了 ROW_NUMBER()，但 Teradata 不允许在 WHERE 子句中使用分析函数。我尝试了 TOP N，但子查询不支持此选项。我尝试了 SAMPLE N，但子查询也不支持它。

所以...我必须承认我现在有点卡住了，想知道是否有任何解决方案可以让我限制使用 Teradata 的子查询中返回的行数，这与到目前为止我做了什么？另外，如果没有，如何以不同的方式构建查询以在 Teradata 中正确使用它？

谢谢!

最佳答案

子查询中 SAMPLE 或 TOP 的使用有限可能是因为这可能是相关子查询。

但是有两种解决方法。

将 SAMPLE 或 TOP 放入子查询内的派生表中(这样就不再关联):

SELECT * FROM myTable
WHERE field1 = 'foo'
AND field2 IN (
     SELECT * FROM
       ( SELECT field2 FROM anotherTable -- or TOP 100
         WHERE field3 = 'bar'  SAMPLE 100
       ) AS dt
    );

或者将其重写为派生表的联接:

SELECT * FROM myTable
JOIN ( SELECT DISTNCT field2 FROM anotherTable -- can't use TOP if you need DISTINCT 
         WHERE field3 = 'bar' SAMPLE 100
       ) AS dt
WHERE field1 = 'foo'
AND myTable.field2 = dt.field1;

没有 ORDER BY 的 TOP 与 ROWNUM 非常相似。它根本不是随机的，但第二次运行它可能仍会返回不同的结果集。

SAMPLE 是真正随机的，每次都会返回不同的结果。

ROW_NUMBER 也可以使用 QUALIFY 而不是 WHERE，但 OLAP 函数总是需要一些 ORDER BY，因此开销要大得多。

关于sql - 使用 Teradata 限制子查询中的行数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25165544/

sql - 使用 Teradata 限制子查询中的行数

上一篇：programming-languages - 为什么编程语言允许从整数到shortint赋值？

下一篇：java - 为什么输出是 "false10"而不是 "false11"？