hadoop - 如何将Cassandra转换为HDFS文件系统以进行Shark/Hive查询

标签 hadoop cassandra hive hdfs apache-spark

有什么方法可以将Cassandra数据公开为HDFS,然后在HDFS上进行perfom shark / Hive查询?

如果是,请提供一些链接以将cassandra db转换为HDFS。

最佳答案

您可以编写身份MapReduce代码,该代码从CFS(cassandra文件系统)获取输入并将数据转储到HDFS。

一旦在HDFS中拥有数据,就可以映射一个配置单元表并运行查询。

关于hadoop - 如何将Cassandra转换为HDFS文件系统以进行Shark/Hive查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20833308/

相关文章:

hadoop - 在 OpenNLP 中合并多个文档分类器模型

Hadoop:级联 FlowException

hadoop - Apache Ranger 2.0.0-SNAPSHOT:无法安装和配置HDFS插件

MongoDb 与 Cassandra :Read/Write myths?

bash - 如何检查docker Cassandra实例是否准备好进行连接

hadoop - Hive - Hive 如何在内部执行多个 BIG 表连接查询(在 MapReduce 中)以及如何对其进行优化?

solr - 删除Cassandra集群中的海量数据

linux - 如何通过 hive 表向 hbase 中插入数据?

Hive FROM_UNIXTIME() 以毫秒为单位

hadoop - 如何根据阿里巴巴MaxCompute中的键对值进行分组?