hadoop - native-lzo 库在 Hadoop 数据节点上不可用

我已经在我的 Gateway/hadoop-env.sh 中编写了一个简单的 LzoWordCount:

HADOOP_CLASSPATH=/opt/cloudera/parcels/HADOOP_LZO/lib/hadoop/lib/hadoop-lzo-cdh4-0.4.15-gplextras.jar
JAVA_LIBRARY_PATH=/opt/cloudera/parcels/HADOOP_LZO-0.4.15-1.gplextras.p0.105/lib/hadoop/lib/native/

当我运行 MR 作业时，我得到:

mapred.JobClient: Task Id : attempt_201307311800_0020_m_000002_2, Status : FAILED java.lang.RuntimeException: native-lzo library not available

有什么办法可以解决这个问题吗？我确实注意到'hadoop类路径| grep native' 什么都不返回？

最佳答案

问题原来是我们没有在数据节点上安装 lzop。我使用以下方法修复了它:

sudo apt-get install lzop

关于hadoop - native-lzo 库在 Hadoop 数据节点上不可用，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18065607/

上一篇：testing - Oozie:在本地测试工作流程

下一篇： pig 的csv读取，csv文件包含引号逗号

hadoop - Spark 不会在 yarn-cluster 模式下运行 final `saveAsNewAPIHadoopFile` 方法

python - 将 python 脚本更改为 Unix 行结束约定

apache-spark - 为什么缓存小型 Spark RDD 需要在 Yarn 中分配大量内存？

hadoop - 远程滚动窗口聚合——时间序列 kudu vs influxdb vs opentsdb

algorithm - 什么是 lzo 和 lzf，有什么区别？

hadoop - hadoop流错误，使用python mapreduce

licensing - 获得 GPLv2 许可的库能否用于专有应用程序？

python - 如何安装 python-lzo-1.08？

java - 文件处理中的 Apache Avro