在 HIVE 中,我尝试使用 2 种方法获取不同行的计数,
SELECT COUNT (*) FROM (SELECT DISTINCT columns FROM table);
SELECT COUNT (DISTINCT columns) FROM table;
两者都产生了不同的结果。 第一个查询的计数大于第二个查询。 他们的工作方式有何不同? 提前致谢。
最佳答案
对您的查询做一点小改动,例如将您的子查询命名为:
SELECT COUNT (*) FROM (SELECT DISTINCT columns FROM table) myquery;
关于SQL/HIVE - 不同计数查询 - SELECT COUNT (DISTINCT columns,..) 与 SELECT COUNT(*) 与 DISTINCT 记录的子查询有何不同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38333125/