apache-spark - 调用 o67.load : java. lang.NoClassDefFoundError: org/apache/hadoop/fs/staging/StagingDirectoryCapable 时出错

标签 apache-spark hadoop amazon-s3 airflow amazon-emr

场景如下:

我正在尝试通过 Spark 读取 EMR 来计算 s3 位置中文件的记录数。

这是我得到的错误:

调用 o67.load 时:java.lang.NoClassDefFoundError:org/apache/hadoop/fs/staging/StagingDirectoryCapable。

该错误是间歇性的,有时会突然出现并且时不时地工作正常。

使用的 Emr 版本 - 5.29.0

最佳答案

org/apache/hadoop/fs/staging/StagingDirectoryCapable.



那必须是 EMR 独有的类/接口(interface);它不在 ASF 代码库中。也许有类路径问题

关于apache-spark - 调用 o67.load : java. lang.NoClassDefFoundError: org/apache/hadoop/fs/staging/StagingDirectoryCapable 时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61630578/

相关文章:

python spark 属性错误: 'module' object has no attribute 'getrusage'

mysql - 从下面给出的示例数据中,删除名称和年龄组合上的重复项并打印结果

python - `df.loc` 的 pyspark 等价物?

hadoop - 有人有配置单元错误代码列表吗?

http - CloudFront 缓存 - 如何确保 CF 在到期后从 S3 原始服务器刷新?

amazon-web-services - AWS Datapipeline RedShiftCopyActivity-如何指定 "columns"

scala - 在执行 pivot spark 之前分组并查找计数

hadoop - 使用正则表达式的配置单元查询

hadoop - 添加规则以使用iptable打开端口,然后hadoop集群不起作用

amazon-s3 - 无服务器 s3 上传访问被拒绝