java - 如何从Impala数据库将字符串数据导入到wordcount mapreduce

标签 java hadoop mapreduce

我试图将Wordcount代码与mapreduce hadoop一起使用。但是,我阅读的几乎所有单词计数教程都是从作业配置的文件路径导入数据。

我想使用Java将impala数据库连接到单词计数mapreduce。

我该如何进行?或者只是在作业配置中输入字符串变量。

最佳答案

实现此目的的一个快速选择是在您的impala / hive session 中发出show create table <table name>并获取表的storage location

重用表的文件路径位置作为wordcount程序的输入路径,并相应地处理记录。

关于java - 如何从Impala数据库将字符串数据导入到wordcount mapreduce,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29960134/

相关文章:

java - Vim - 自动完成 Java

java - 在 Hadoop map-reduce 中对连接的数据进行分组

java - Excel 文件(xls) 的自定义InputFormat 或InputReader

java - 在 Java 中使用 HTMLEditorKit,如何找到 <img src=...> 标签将使用的本地文件路径?

java - 如何为从 Eclipse 运行的程序指定默认 JVM 参数?

java - STS 需要很长时间才能启动

linux - 配置多节点 hadoop 安装

hadoop - 如何读取子工作流(单独的 xml 文件)中的配置属性?

java - java.io.IOException:使用Combiber在MapReduce中溢出失败

hadoop - Jobtrackernotyetrunning错误?