java - 为什么 Hive 和 HiveServer2 需要 mapred.InputFormat?

标签 java hadoop mapreduce hive

我只是想确保我没有遗漏任何东西。我正在为 Hive 开发一个 InputFormat 来处理我们特定的 hdfs 文件格式。我刚刚意识到它需要扩展 mapred.InputFormat 而不是 mapreduce.InputFormat

这样对吗?或者我错过了什么?我可以使用 mapreduce 包中的 FileInputFormat 吗?

最佳答案

您将不得不使用 mapred.InputFormat Hive 尚未完全迁移到新包。如果您出于任何原因需要/想要使用 mapreduce.InputFormat 包,您始终可以包装 mapreduce.InputFormat。事实上,我就是这样做的,让它与 Hive 交互,但仍然利用 mapreduce 包。

编辑:为了在两种类型的 API 之间进行互操作,我将读取文件记录的逻辑抽象为另一个类,并在两种 InputFormats 中使用它。

关于java - 为什么 Hive 和 HiveServer2 需要 mapred.InputFormat?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28464906/

相关文章:

java - 如何使用 Java Access Bridge 自动化 Java Applet?

hadoop用户文件权限

hadoop - 运行组命令时 Pig 减少作业卡在 50%

Hadoop:作业如何发送到 master 和 MapReduce 上的节点?

hadoop - 如果hadoop集群配置为利用kerberos身份验证,那么是否需要配置MapReduce作业来处理它?

java - 使用 LeanFt 测试 Editfield 是否可编辑

java - Play框架无法连接到WS

java - 在 hadoop 的迭代作业中,在每个拆分的 mapreduce 输入文件上附加相同的字符串(先前的结果)

java - Main.axml打不开VS2015

hadoop - 驱动程序类编译错误-hadoop Mapreduce