sql - 需要对一列进行分组添加以获取Hive中另一列的计数

标签 sql hadoop group-by hive hiveql

这是我的示例数据:

在上表中,我们可以看到a1,a2,a3和a4都具有src1。我只需要a3和a4作为结果,因为它们是仅嵌入了src1的仅有的行。 a1和a2具有其他src2,...等等。

我需要一个配置单元查询才能得到结果。

最佳答案

您可以按col1进行聚合,并使用having子句过滤col1,后者的唯一值是col2

select col1
from mytable
group by col1
having min(col2) = max(col2) and min(col2) = 'src1'

关于sql - 需要对一列进行分组添加以获取Hive中另一列的计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61246475/

相关文章:

sql - 使用 Firebird.NET 2.5 执行 SQL 脚本时出现问题(错误代码 = -104)

hadoop - 在 Apache Pig Latin 中转置数据

mysql - 从 MySQL 选择表名作为文件发送到 HDFS

mysql - 选择组中的第一个和最后一个值

Python Pandas - 在 Groupby 内部迭代以查找时间差异

sql - 如何使用LAMBDA表达式在LINQ中进行IN或CONTAINS处理?

sql - 加入 OR 的性能

java - 如何在Java derby中自动增加数据库列?

hadoop - yarn java进程没有被杀死

mysql - 每个键选择两行最近的时间