hadoop - 将文件从不安全的 hdfs 传输到安全的 hdfs 集群

标签 hadoop hdfs kerberos distcp

我想将文件从不安全的 HDFS 集群传输到 kerberized 集群。我正在使用 distcp 来传输文件。我使用了以下命令。

hadoop distcp -D ipc.client.fallback-to-simple-auth-allowed=true hdfs://<ip>:8020/<sourcedir> hdfs://<ip>:8020/<destinationdir>

在 kerberized 集群中执行上述命令后出现以下错误。

java.io.EOFException: End of File Exception between local host is: "<xxx>"; destination host is: "<yyy>; : java.io.EOFException; For more details see:  http://wiki.apache.org/hadoop/EOFException

最佳答案

这是错误的,因为:

cluster is blocked for RPC communication, in such cases, webhdfs protocol can be used, so above distcp can be rewritten as

hadoop distcp -D ipc.client.fallback-to-simple-auth-allowed=true hdfs://xxx:8020/src_path webhdfs://yyy:50070/target_path

这个很好blog post for distcp

关于hadoop - 将文件从不安全的 hdfs 传输到安全的 hdfs 集群,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42253923/

相关文章:

MongoDB 和 Apache Spark 投影

hadoop - 如何解决二十个新闻组分类示例上的加载主类MahoutDriver错误

hadoop - hadoop 安装过程中无法运行 yarn

hadoop - 从HDFS上名称前有空格的文件夹访问数据

Hadoop - FileSystem.listFiles - 不列出目录

security - 在 CentOS 6 上配置 Kerberos 时出错

hadoop - 使用oozie的 hive 的循环协调器

hadoop - yarn : Controlling concurrency of jobs

r - 如何使用 Kerberos keytab 通过 R 连接 HIVE?

c# - 如何以编程方式清除 Kerberos 票证缓存