如果这是一个菜鸟问题,我深表歉意,但我找不到任何相关引用 -
这两个有什么区别?
如果我想使用 pyarrow 从 hdfs 读取 parquet 文件,我会使用哪个?
最佳答案
HdfsClient
API 已弃用,您想现在使用 pyarrow.hdfs.connect
进行连接:http://arrow.apache.org/docs/python/filesystems.html#hadoop-file-system-hdfs
关于hadoop - PyArrow 中的 hdfs.connect() 与 HdfsClient,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47400987/