hadoop - 确认为特定 Hive 表启用了压缩

标签 hadoop hive

我需要对一系列表格进行基准测试,有些是压缩的,有些不是。我通过设置压缩:

hive> SET hive.exec.compress.output=true;
hive> SET mapred.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec;

...并使用 INSERT OVERWRITE 填充表。有没有办法通过命令行(类似于 DESCRIBE EXTENDED)确认为特定表启用了输出压缩?

最佳答案

当您执行 describe formatted orc_with_compress_setting_table 时,会看到如下内容:

压缩:没有并且感觉不舒服。

这里是答案:

The Compressed field is not a reliable indicator of whether the table contains compressed data. It typically always shows No, because the compression settings only apply during the session that loads data and are not stored persistently with the table metadata.

来自:https://www.cloudera.com/documentation/enterprise/5-5-x/topics/impala_describe.html

关于hadoop - 确认为特定 Hive 表启用了压缩,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21294629/

相关文章:

hadoop - HIVE QUERY SELECT * FROM bookfreq where freq IN (SELECT Max(freq) FROM bookfreq);

hadoop - 在单独的节点上设置hiveserver2和hive metastore

database - HDFS 中存储了什么以及为什么 Titan 执行查询时 map-reduce 计算速度如此之快?

hadoop - 我不明白 CapacityScheduler 中的 "The sum of capacities for all queues, at each level, must be equal to 100"

java - 使用java程序合并hdfs中的文件

hadoop - VirtualBox CentOS 6.4中Accumulo初始化异常

hadoop - 将 Dataframe 存储到 spark 中的配置单元分区表

networking - 我可以使用 100 Mbps 网络交换机进行 Hadoop 迷你集群设置吗?

amazon-web-services - 横向 View 快速爆炸

rdbms - 如何设计Hbase架构?