我一直在尝试找到一种方法来获取(或传递)taskId 到我的 C++ 映射器。我正在使用 hadoop 流媒体。到目前为止,我刚刚知道如何在 Java 中获取它。我需要任务 ID,因为我正在尝试将文件写入 HDFS,我使用的是 libhdfs c,但是当我尝试同时追加时,由于租约,它失败了。否则,我将不得不将我的所有代码都更改为 Java。
感谢您的关注。
最佳答案
我想我可以使用 Hadoop Pipes 来获取 taskID,而不是使用 Hadoop Streaming。但是,我无法打印到 HDFS,因此我更改了 InputFormat/RecordReader 并使用映射器中收到的 key 来创建具有不同名称的文件。
关于c++ - Hadoop流C++ getTaskId,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28583997/