Hadoop 为 java.nio.ByteBuffer 的键类型抛出 ClassCastException

标签 hadoop mapreduce bytebuffer hadoop-streaming

我正在为我的集群设置使用“hadoop-0.20.203.0rc1.tar.gz”。 每当我设置 job.setMapOutputKeyClass(ByteBuffer.class);

并运行我得到以下异常的作业:

    12/01/13 15:09:00 INFO mapred.JobClient: Task Id : attempt_201201131428_0005_m_000001_2, Status : FAILED
java.lang.ClassCastException: class java.nio.ByteBuffer
        at java.lang.Class.asSubclass(Class.java:3018)
        at org.apache.hadoop.mapred.JobConf.getOutputKeyComparator(JobConf.java:776)
        at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.<init>(MapTask.java:958)
        at org.apache.hadoop.mapred.MapTask$NewOutputCollector.<init>(MapTask.java:673)
        at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:755)
        at org.apache.hadoop.mapred.MapTask.run(MapTask.java:369)
        at org.apache.hadoop.mapred.Child$4.run(Child.java:259)
        at java.security.AccessController.doPrivileged(Native Method)
        at javax.security.auth.Subject.doAs(Subject.java:396)
        at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1059)
        at org.apache.hadoop.mapred.Child.main(Child.java:253)

我还注意到 ByteBuffer 是可比较的而不是可写的,这有什么区别吗? 如果需要任何其他信息,请告诉我。

最佳答案

这是抛出异常的地方。这是 code来自 SVN。

public RawComparator getOutputKeyComparator() {
    Class<? extends RawComparator> theClass = getClass("mapred.output.key.comparator.class",
        null, RawComparator.class);
    if (theClass != null)
        return ReflectionUtils.newInstance(theClass, this);
    return WritableComparator.get(getMapOutputKeyClass().asSubclass(WritableComparable.class));
}

如果未在 JobConf 上定义 mapred.output.key.comparator.class 属性,则该键必须实现 WritableComparable 接口(interface)。 ByteBuffer 类没有实现 WritableComparable 接口(interface),所以异常。

顺便说一句,WritableComparable interface 是 Writable 和 Comparable 类的子接口(interface)。

关于Hadoop 为 java.nio.ByteBuffer 的键类型抛出 ClassCastException,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8853064/

相关文章:

hadoop - 将每个系统设置为数据节点并从每个系统获取数据

hadoop - 在用 Java 编写 MR 代码时,如何决定何时使用 Map-Side Join 或 Reduce-Side?

java - java中的ByteBuffer在没有写入任何内容时返回数据,不会抛出异常

java - 在字节缓冲区中处理不同数据类型的最佳实践是什么

java - 使用 AvroMultipleOutputs 创建多个输出文件

hadoop - 大数据Hadoop HDFS——put命令

hadoop - 如何获取特定正在运行的Hadoop作业的作业ID

hadoop - 运行 Hadoop Wordcount 作业错误

hadoop - 收到错误消息:- map 中的键键入不匹配:预期的org.apache.hadoop.io.Text,收到的org.apache.hadoop.io.LongWritable

Java ByteBuffer 清除数据