如何在Amazon EMR的工作流程中指定要使用的自定义RecordReader
?
注:此处是 Hadoop新手。
最佳答案
您可以在驱动程序类中指定输入格式(该类包含作业的“主要”。记录读取器是输入格式的逻辑部分,实际上会将其返回到映射任务。
我认为这不是EMR特有的。
关于hadoop - EMR作业中的自定义RecordReader,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10730334/
如何在Amazon EMR的工作流程中指定要使用的自定义RecordReader
?
注:此处是 Hadoop新手。
最佳答案
您可以在驱动程序类中指定输入格式(该类包含作业的“主要”。记录读取器是输入格式的逻辑部分,实际上会将其返回到映射任务。
我认为这不是EMR特有的。
关于hadoop - EMR作业中的自定义RecordReader,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10730334/