hadoop - EMR上的Snappy not available错误

标签 hadoop amazon-web-services apache-spark snappy

我在具有一个主节点和一个核心节点的EMR上使用Spark,但面临以下问题:

java.lang.RuntimeException: native snappy library not available: this version of libhadoop was built without snappy support.

我将java.library.path设置为/ usr / lib / hadoop / lib / native /:/ usr / lib / hadoop-lzo / lib / native /

checknative在主节点和核心节点上为我提供了此功能:
16/04/28 15:03:27 INFO bzip2.Bzip2Factory: Successfully loaded & initialized native-bzip2 library system-native
16/04/28 15:03:27 INFO zlib.ZlibFactory: Successfully loaded & initialized native-zlib library
Native library checking:
hadoop:  true /usr/lib/hadoop/lib/native/libhadoop.so.1.0.0
zlib:    true /lib64/libz.so.1
snappy:  true /usr/lib/hadoop/lib/native/libsnappy.so.1
lz4:     true revision:99
bzip2:   true /lib64/libbz2.so.1
openssl: true /usr/lib64/libcrypto.so

EMR版本:emr-4.6.0

Hadoop发行版:Amazon 2.7.2

应用程序:Spark 1.6.1

最佳答案

我终于找到了解决方案,我设置了LD_LIBRARY_PATH,它现在可以工作了!

export LD_LIBRARY_PATH=/usr/lib/hadoop/lib/native/

我在所有节点上都执行了此操作。我希望它可以帮助某人:)!

关于hadoop - EMR上的Snappy not available错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36918719/

相关文章:

hadoop - 用Pig清理数据

amazon-web-services - AWS SAM : Use an existing SQS Queue in template

apache-spark - ShuffledRDD、MapPartitionsRDD 和 ParallelCollectionRDD 之间有什么区别?

algorithm - 当我有预测和地面实况文件(原始图表)时,如何使用 spark 和 scala 计算 TP、TN、FP 和 FN?

java - 停止 Spark 流

hadoop - map task 是否并行读取其输入数据?

hadoop - Mapper类型不是通用的hadoop eclipse插件

amazon-web-services - 无法在 AWS EC2 - Linux 实例中打开公共(public) IPv4 DNS

web-services - 使用亚马逊服务查询亚马逊网站上的商品

java - Hive UDF 将 array<string> 作为参数传递