java - Hadoop:配置对象时出错

标签 java exception hadoop mapreduce cloudera

我正在尝试运行 Terasort 基准测试,但出现以下异常:

java.lang.RuntimeException: Error in configuring object
    at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:93)
    at org.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:64)
    at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:117)
    at org.apache.hadoop.mapred.MapTask$OldOutputCollector.<init>(MapTask.java:573)
    at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:435)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:371)
    at org.apache.hadoop.mapred.Child$4.run(Child.java:259)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:396)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1059)
    at org.apache.hadoop.mapred.Child.main(Child.java:253)
Caused by: java.lang.reflect.InvocationTargetException
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
    at java.lang.reflect.Method.invoke(Method.java:597)
    at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:88)
    ... 10 more
Caused by: java.lang.IllegalArgumentException: can't read paritions file
    at org.apache.hadoop.examples.terasort.TeraSort$TotalOrderPartitioner.configure(TeraSort.java:213)
    ... 15 more
Caused by: java.io.FileNotFoundException: File _partition.lst does not exist.
    at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:371)
    at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:245)
    at org.apache.hadoop.fs.FileSystem.getLength(FileSystem.java:720)
    at org.apache.hadoop.io.SequenceFile$Reader.<init>(SequenceFile.java:1417)
    at org.apache.hadoop.io.SequenceFile$Reader.<init>(SequenceFile.java:1412)
    at org.apache.hadoop.examples.terasort.TeraSort$TotalOrderPartitioner.readPartitions(TeraSort.java:153)
    at org.apache.hadoop.examples.terasort.TeraSort$TotalOrderPartitioner.configure(TeraSort.java:210)
    ... 15 more

TeraGen 命令运行良好,并为 TeraSort 创建了输入文件。这是我的输入目录的列表:

bin/hadoop fs -ls /user/hadoop/terasort-input/Warning: Maximum heap size rounded up to 1024 MB
Found 5 items
-rw-r--r--   1 sqatest supergroup           0 2012-01-23 14:13 /user/hadoop/terasort-input/_SUCCESS
drwxr-xr-x   - sqatest supergroup           0 2012-01-23 13:30 /user/hadoop/terasort-input/_logs
-rw-r--r--   1 sqatest supergroup         129 2012-01-23 15:49 /user/hadoop/terasort-input/_partition.lst
-rw-r--r--   1 sqatest supergroup 50000000000 2012-01-23 13:30 /user/hadoop/terasort-input/part-00000
-rw-r--r--   1 sqatest supergroup 50000000000 2012-01-23 13:30 /user/hadoop/terasort-input/part-00001

这是我运行 terasort 的命令:

bin/hadoop jar hadoop-examples-0.20.203.0.jar terasort -libjars hadoop-examples-0.20.203.0.jar /user/hadoop/terasort-input /user/hadoop/terasort-output

我确实在我的输入目录中看到文件 _partition.lst,我不明白为什么我会收到 FileNotFoundException。

我遵循了以下位置提供的设置详细信息:http://www.michael-noll.com/blog/2011/04/09/benchmarking-and-stress-testing-an-hadoop-cluster-with-terasort-testdfsio-nnbench-mrbench/

最佳答案

我让它按如下方式工作:

我在本地模式下从我的 hadoop 基本目录运行,hadoop-1.0.0 下有一个输入子目录,我得到了和你一样的错误。

我编辑了失败的 java 文件,让它记录路径而不是文件名,重建它(“ant binary”),然后重新运行它。它在我运行的目录中寻找文件。我不知道它是在查找 hadoop 基本目录还是执行目录。

...所以我在运行 terasort 的目录中创建了一个符号链接(symbolic link),指向输入目录中的真实文件。

这是一个廉价的 hack,但它有效。

- Tim.

关于java - Hadoop:配置对象时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8980412/

相关文章:

java - 中断正在运行 Stream API 操作的线程

java - 使用值 'supplierPaidChecks[0].checkNo' 设置表达式 '[Ljava.lang.String;@1ac1423' 时出错

java - XmlPullParser 名称预期异常

python - 2 个键的 MapReduce Reducer - Python

hadoop - 从日志存档创建Spark Dstream

java - 为什么这个 Java 查询失败?有结果时返回0

java - 围绕 "same erasure"编译错误的奇怪行为

java - 捕获错误(而不是异常)有什么意义,因为程序不会由 JVM 启动

c# - DbContext.SaveChangesAsync 异常处理

Hadoop 独立实例在执行 MR 作业期间退出,日志中出现 ExpiredTokenRemover 错误(在少数作业成功执行后)