unique - 在 Hive 中的特定列上不同

标签 unique distinct hive

我正在运行 Hive 071
我有一个表,多行,具有相同的列值
例如

 x | y |
---------
 1 | 2 |
 1 | 3 |
 1 | 4 |
 2 | 2 |
 3 | 2 |
 3 | 1 |

我想让 x 列唯一,并删除具有相同 x val 的行
例如
 x | y |
---------
 1 | 2 |
 2 | 2 |
 3 | 2 |


 x | y |
---------
 1 | 4 |
 2 | 2 |
 3 | 1 |

都很好
由于不同的工作仅适用于 hive 中的整个 rs,我找不到方法来做到这一点

请帮忙
发送

最佳答案

您可以使用 distinct 关键字:

SELECT DISTINCT x FROM table

关于unique - 在 Hive 中的特定列上不同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7401543/

相关文章:

sql - 不同的命令不起作用

apache-spark - 带有 Hive Metastore 3.1.0 的 Apache Spark 2.3.1

php - MySQL/PHP - 避免重复 - (INSERT, UNIQUE, REPLACE)

python - 将 DataFrame 列中的唯一值替换为其计数

javascript - 如何从 Javascript 中的对象列表中获取不同的年份

scala - 有没有办法重写 Spark RDD distinct 以使用 mapPartitions 而不是 distinct?

r - 如何从数据表中的列子集中提取唯一行?

c# - 如何生成唯一的 12 位数字?

json - 我应该以哪种格式以及如何将我的 JSON 行(如数据)导入到 hadoop 中?

hadoop - hive -e 带分隔符