hadoop - HDFS元数据占用太多空间

标签 hadoop hbase metadata hdfs

我正在尝试将数据从SQL数据库迁移到具有Hadoop的HBase。但是问题是我的数据库在SQL中有70 GB的空间,当我将其转移到Hadoop时需要大约400 GB。为什么会这样呢?有什么办法可以减少使用的空间。

如果我有800 GB的SQL数据库数据,还需要多少磁盘空间。

最佳答案

经过大量搜索之后,我遇到了一些结果,我将数据存储为Hadoop的默认格式,即文本格式。因此,与其他存储相比,它将消耗大量空间来存储数据。 Manjunath也是正确的,因为我们减少了复制因子,它可能会减少存储空间,但也会引起一些问题。有关此主题的更多信息,请引用下面提到的链接:

http://datametica.com/rcorc-file-format/

关于hadoop - HDFS元数据占用太多空间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33772656/

相关文章:

r - 将R Sys.time()转换为 hive 时间戳data_type

exception - 错误-尝试在伪分布式模式下运行hbase吗?

solr - 如何删除solr和hbase中的所有数据

hadoop - 在hadoop中合并两个文件

Hadoop - 从 HDFS 中的多个目录创建外部表

pandas - 将 Spark 数据帧转换为 Pandas/R 数据帧的要求

hadoop - HBase master 停止并出现 "Connetion Refused"错误

web-services - 使用 RESTful Web 服务的结果作为 Crystal Reports 中的数据

python - eyed3 for python - 如何从音频文件加载选择性 id3 数据?

c# - 如何在Bitmap header中存储ASCII信息?