hadoop - 多列的百分位数

标签 hadoop hive

我有一个包含大约 200-250 列的表格,我想计算其中每一列的百分位数。

Hive 给出函数 Percentile(int_exp,p) 返回列 int_exp 的第 p 个百分位值。但是对其余 250 列运行相同的查询似乎是多余的。有没有办法一次性找到所有列的百分位数?

最佳答案

不幸的是,您将不得不为每一列调用百分位数函数。一个建议是您可以使用某种其他语言(例如 Java、Ruby、Python 等)动态生成此查询

关于hadoop - 多列的百分位数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14673249/

相关文章:

hadoop - 设计 MapReduce 函数以查找集合列表之间的交集

hadoop - 增量 sqoop 到 HIVE 表

hadoop - Hive/Tez作业无法开始

java - 无法执行基本的 Hadoop Mapreduce Wordcount 示例

python - Apache Pig-在相同关系上嵌套的FOREACH

hadoop - Namenode文件数量限制

encryption - 使用 UDF 的 Hive 查询

hadoop - Impala 查询编辑器始终显示 AnalysisException

hadoop - 使用Oozie在hbase上创建hive表导致libthrift出错?

hadoop - 表格编程