hadoop - HBase 中的压缩

标签 hadoop hbase

我正在使用 HBase 来存储大量传感器数据。

我曾尝试使用一个 txt 文件来存储我的传感器数据,对于一个 20MB 的文件,如果我压缩它,它将在磁盘上减少到 1MB。

我的问题是:HBase本身在存储数据到磁盘时会自动压缩吗?

谢谢

最佳答案

您可以使用 lzo、gzip 或 snappy 进行 hbase 压缩。如果您希望将它们用于 hbase 压缩(包括 gzip),则需要自己设置 lzo/snappy。

通常 - lzo 比 gzip 压缩更快,尽管 gzip 压缩比通常更好。 Snappy 在压缩方面很稳健,但压缩率通常更差。

创建表时 - 您可以指定压缩/压缩库 - 如果使用压缩,则 hfiles 在写入磁盘时会被压缩(读取时需要解压缩)。

希望对你有帮助

关于hadoop - HBase 中的压缩,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12064709/

相关文章:

java - Spark Yarn Cluster 连接到 Hbase 错误

java - 每个 HBase 表一个 Reducer

hadoop - 如何在Hive CLI中检查设置?

java - PIG - 找到接口(interface) org.apache.hadoop.mapreduce.JobContext,但类是预期的

map - 打印独特或独特的值(value)

java - 如何覆盖特定类的log4j设置

maven - Hadoop/Hbase : java. lang.NoClassDefFoundError:org/apache/hadoop/hbase/HBaseConfiguration

hadoop - sqoop增量导入命令出错

hadoop - CDH4 : Version conflict: Found interface org. apache.hadoop.mapreduce.Counter,但类是预期的

java - 运行 Hbase Java API 时出错