mongodb - 如何将多种格式的数据处理为配置单元

标签 mongodb hadoop hive

这是我的hdfs文件。我的文件包含5列,例如id,fname,lname,interest,address。如何将数据从hdfs存储到配置单元。

 id         fname   lname              interest

654321.0    John      Doe        [ "electronics" , "sports" , "music"]  

                     address

{ "name" : "John Doe" , "company" : "Resultri" , "street" : "1015 Mapple   
Street" ,"city" : "San Francisco" , "state" : "CA" , "zip_code" : 94105.0}

有什么想法可以解决这个问题吗?

最佳答案

http://rishavrohitblog.blogspot.in/2013/10/connecting-hive-to-mongodb-using.html

可以尝试使用上面的帖子。

问候,
钦纳克里希纳

关于mongodb - 如何将多种格式的数据处理为配置单元,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33998046/

相关文章:

function - 如何在 Mongo 的 update() 函数中使用 $add?

javascript - Mongoose 查找所有引用的文档

mongodb - 如何在 docker 容器中启动 mongodb shell?

security - 什么是 key 表?

macos - 无法在 Mac OS X 上运行 mongodb

hadoop - 从分区文件结构创建 Impala 外部表

java - 自定义 InputFormat.getSplits() 从未在 Hive 中调用

hadoop - teragen "rows"不是应该以换行符 (\r\n) 结尾吗?

hadoop - 如何将新数据附加到现有的配置单元表

datetime - 在 Hive 中将字符串转换为时间戳