sql - Hadoop配置单元查询

标签 sql hadoop hive

enter image description here

我在表中有这些类型的行,第一个是电影ID,第二个是电影标题,第三个是一个人给出的评分。 有不同的电影。并非所有人都是玩具总动员,例如。它只是有限的。

我的问题是这样的:
给出评分最高的电影的名称

因此,例如:如果有6个人给一部电影评分为1星,则总和为6。现在,对于另一部电影,还有2个人给评分,其中1个人给5星,另外1个人给1星。然后第二部是收视率最高的电影。

我需要找到与hadoop配置单元一起工作的答案。

这是我到目前为止所能做的。
不知道我是否需要功能或其他功能。

enter image description here

最佳答案

用这个,

select a.movie_name from (
select movie_name, sum(rating) as r, count(*) as cnt
from tableMovieDetail
group by movie_name  ) a
order by a.r , cnt desc

关于sql - Hadoop配置单元查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46560184/

相关文章:

sql - 比较具有相同架构的两个配置单元表中的记录

hadoop - Hive 中的外部表

php - SQL 错误 : #1242 - Subquery returns more than 1 row

PHP/SQL - 改进搜索功能/模糊搜索

sql - 更改表添加列语法

java - Hadoop 配置文件输出 - 在哪里和什么?

apache-spark - 将 6000 亿条记录从 1 个配置单元表加载到另一个

python - cx_oracle 缺少右括号

hadoop - 使用YARN Resource Manager REST API + elasticsearch + Kibana的Hadoop Jobs统计信息

hadoop - 数据未从 HIVE 中的文件传输到表