amazon-web-services - 使用亚马逊弹性mapreduce服务时如何在hadoop中包含第三方库

我必须使用名为 weka 的第三方库执行一些数据挖掘任务。但我不确定如何在 amazon elastic mapreduce 服务中包含所需的 jar 文件。

有没有人有处理过这种情况的经验？

最佳答案

一个简单的解决方案是使用映射器和缩减器将依赖项放入 jar 文件中。

如果您使用 Maven 构建我建议使用 Maven Assembly Plugin用于打包具有所有依赖项的单个 jar 的插件。

关于amazon-web-services - 使用亚马逊弹性mapreduce服务时如何在hadoop中包含第三方库，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13059165/