hadoop - native-lzo 库在 Hadoop 数据节点上不可用

标签 hadoop lzo

我已经在我的 Gateway/hadoop-env.sh 中编写了一个简单的 LzoWordCount:

HADOOP_CLASSPATH=/opt/cloudera/parcels/HADOOP_LZO/lib/hadoop/lib/hadoop-lzo-cdh4-0.4.15-gplextras.jar
JAVA_LIBRARY_PATH=/opt/cloudera/parcels/HADOOP_LZO-0.4.15-1.gplextras.p0.105/lib/hadoop/lib/native/

当我运行 MR 作业时,我得到:

mapred.JobClient: Task Id : attempt_201307311800_0020_m_000002_2, Status : FAILED java.lang.RuntimeException: native-lzo library not available

有什么办法可以解决这个问题吗?我确实注意到'hadoop类路径| grep native' 什么都不返回?

最佳答案

问题原来是我们没有在数据节点上安装 lzop。我使用以下方法修复了它:

sudo apt-get install lzop

关于hadoop - native-lzo 库在 Hadoop 数据节点上不可用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18065607/

相关文章:

ios - iOS 是否将 LZO 魔数(Magic Number)放在压缩内存的开头?

hadoop - Spark 不会在 yarn-cluster 模式下运行 final `saveAsNewAPIHadoopFile` 方法

python - 将 python 脚本更改为 Unix 行结束约定

apache-spark - 为什么缓存小型 Spark RDD 需要在 Yarn 中分配大量内存?

hadoop - 远程滚动窗口聚合——时间序列 kudu vs influxdb vs opentsdb

algorithm - 什么是 lzo 和 lzf,有什么区别?

hadoop - hadoop流错误,使用python mapreduce

licensing - 获得 GPLv2 许可的库能否用于专有应用程序?

python - 如何安装 python-lzo-1.08?

java - 文件处理中的 Apache Avro