我试图将Wordcount代码与mapreduce hadoop一起使用。但是,我阅读的几乎所有单词计数教程都是从作业配置的文件路径导入数据。
我想使用Java将impala数据库连接到单词计数mapreduce。
我该如何进行?或者只是在作业配置中输入字符串变量。
最佳答案
实现此目的的一个快速选择是在您的impala / hive session 中发出show create table <table name>
并获取表的storage location
。
重用表的文件路径位置作为wordcount程序的输入路径,并相应地处理记录。
关于java - 如何从Impala数据库将字符串数据导入到wordcount mapreduce,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29960134/