amazon-web-services - 使用亚马逊弹性mapreduce服务时如何在hadoop中包含第三方库

标签 amazon-web-services hadoop mapreduce amazon-emr

我必须使用名为 weka 的第三方库执行一些数据挖掘任务。但我不确定如何在 amazon elastic mapreduce 服务中包含所需的 jar 文件。

有没有人有处理过这种情况的经验?

最佳答案

一个简单的解决方案是使用映射器和缩减器将依赖项放入 jar 文件中。

如果您使用 Maven 构建我建议使用 Maven Assembly Plugin用于打包具有所有依赖项的单个 jar 的插件。

关于amazon-web-services - 使用亚马逊弹性mapreduce服务时如何在hadoop中包含第三方库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13059165/

相关文章:

amazon-web-services - 供 Amazon SWF 决策者检查事件任务状态的高级 PHP 库

amazon-web-services - aws cli 日志过滤模式排除

java - 如何在 MapReduce hadoop 中使用 GeoLite 数据库?

eclipse - java.io.IOException : No FileSystem for scheme: maprfs 异常

amazon-web-services - 子网内的 Lambda 如何访问 VPC 端点?

ios - Amazon AWS DynamoDB 帮助选择主键

loops - 使用循环在HBase中创建多个列限定符

hadoop - Cosmos Hive 错误进入和使用 map reduce

r - R中的Hadoop wordcount示例

hadoop - 如何从ftp服务器导入csv文件到hadoop(HDFS/HIVE/HBASE)?