hadoop - 如何将Cassandra转换为HDFS文件系统以进行Shark/Hive查询

有什么方法可以将Cassandra数据公开为HDFS，然后在HDFS上进行perfom shark / Hive查询？

如果是，请提供一些链接以将cassandra db转换为HDFS。

最佳答案

您可以编写身份MapReduce代码，该代码从CFS(cassandra文件系统)获取输入并将数据转储到HDFS。

一旦在HDFS中拥有数据，就可以映射一个配置单元表并运行查询。

关于hadoop - 如何将Cassandra转换为HDFS文件系统以进行Shark/Hive查询，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20833308/

相关文章：

hadoop - 在 OpenNLP 中合并多个文档分类器模型