有什么方法可以将Cassandra数据公开为HDFS,然后在HDFS上进行perfom shark / Hive查询?
如果是,请提供一些链接以将cassandra db转换为HDFS。
最佳答案
您可以编写身份MapReduce代码,该代码从CFS(cassandra文件系统)获取输入并将数据转储到HDFS。
一旦在HDFS中拥有数据,就可以映射一个配置单元表并运行查询。
关于hadoop - 如何将Cassandra转换为HDFS文件系统以进行Shark/Hive查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20833308/