c++ - Hadoop流C++ getTaskId

标签 c++ hadoop hadoop-streaming

我一直在尝试找到一种方法来获取(或传递)taskId 到我的 C++ 映射器。我正在使用 hadoop 流媒体。到目前为止,我刚刚知道如何在 Java 中获取它。我需要任务 ID,因为我正在尝试将文件写入 HDFS,我使用的是 libhdfs c,但是当我尝试同时追加时,由于租约,它失败了。否则,我将不得不将我的所有代码都更改为 Java。

感谢您的关注。

最佳答案

我想我可以使用 Hadoop Pipes 来获取 taskID,而不是使用 Hadoop Streaming。但是,我无法打印到 HDFS,因此我更改了 InputFormat/RecordReader 并使用映射器中收到的 key 来创建具有不同名称的文件。

关于c++ - Hadoop流C++ getTaskId,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28583997/

相关文章:

文件缓存选项

c++ - 为什么自动说明符从 &pointer 推断出 "top and low"级别常量?

hadoop - sqoop导出到hana失败

hadoop - 澄清hadoop中的Map任务和reduce任务?

java - Hadoop安装错误

python - Hadoop沙盒上的Os X流上的python客户端

C++ : How to make a specific binary (executable) for each trait?

c++ - 非常大矩阵的线性计算

c++ - 什么是常数引用? (不是对常量的引用)

apache-spark - 使用Avro序列化RDD