我必须使用名为 weka 的第三方库执行一些数据挖掘任务。但我不确定如何在 amazon elastic mapreduce 服务中包含所需的 jar 文件。
有没有人有处理过这种情况的经验?
最佳答案
一个简单的解决方案是使用映射器和缩减器将依赖项放入 jar 文件中。
如果您使用 Maven 构建我建议使用 Maven Assembly Plugin用于打包具有所有依赖项的单个 jar 的插件。
关于amazon-web-services - 使用亚马逊弹性mapreduce服务时如何在hadoop中包含第三方库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13059165/