我正在学习 Hadoop MapReduce 框架。我正在努力寻找为什么我们不能在 Map Reduce 中使用 Java 原始数据类型。
最佳答案
Java 序列化要求类的散列以序列化格式在对象的每个实例之前加上前缀。因此,要读取对象,您不需要指定类名。这会导致读取对象的开销,因为每个对象都可以是不同类的实例。
在 Hadoop 序列化中,我们在检索时指定类名。因此,不需要前缀,因为我们已经知道要检索的内容。因此我们设置了 InputFormat。这提高了 RPC 过程中各方面的速度和性能。
关于java - 为什么我们不能在 Map Reduce 中使用 Java 原始数据类型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33892074/