有没有办法在不知道完整文件名的情况下从存在于HDFS特定路径上的序列文件中读取数据?
例如,如果我知道文件的名称为-modelSomeIterationAOtherIterationB,并且它是该路径上唯一以“model”开头的文件,是否可以通过指定“path / to / file / model *”之类的内容来读取它?
最佳答案
是的,您可以使用FileSystem globStatus()方法。
//创建FileSystem对象fs
fs.globStatus(new Path(“path / to / file / model *”))
关于hadoop - 在HDFS上读取以,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30969261/