python hdfs 远程上传文件到hdfs

标签 python hadoop hdfs

我想通过 python 模块“hdfs”将文件远程上传到我的 hdfs。 我的hadoop在我的linux上运行,但我想远程上传我windows(或其他电脑)上的文件。当我使用如下代码时:

from hdfs import InsecureClient
client = InsecureClient('http://xx.xx.xx.xx:50070', user='user')

我可以使用 client.walk('/') 查看目录,但我无法上传文件,它引发如下错误:

requests.packages.urllib3.exceptions.NewConnectionError: <requests.packages.urllib3.connection.HTTPConnection object at 0x03256BB0>: Failed to establish a new connection: [Errno 10061]

我觉得是权限的问题,不知道怎么解决。 你能帮帮我吗?

最佳答案

在使用client.upload()时namenode会返回datanode的地址给client,所以你要保证你的client能到达这个地址。可能是您为 hdfs 设置了主机名而不是 ip,那么您应该将主机名项添加到您的“/etc/hosts”文件。

关于python hdfs 远程上传文件到hdfs,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42944469/

相关文章:

python - 如何计算 YAML 中定义的代数表达式?

python - 如何在 Windows 10 conda 上安装 torch 音频?

javascript - 使用 jquery 或 javascript 单击时切换复选框标签周围的边框

java - Hadoop中最原始方式的数据协调

Hadoop Wordcount 程序编译错误

python - LED闪烁如何打发时间。 sleep RPI

unix - 如何使用腻子将文件从hdfs加载到本地服务器?

hadoop - 如何从HDFS删除中间输出文件

hadoop - Hive 外部表架构重新连接

hadoop - 是否可以配置clickhouse数据存储为hdfs