hdfs - 为什么 Impala 花费大量时间打开 HDFS 文件(TotalRawHdfsOpenFileTime)？

我发现我的Impala swarm表现不稳定，正常情况下只需要几秒(不到10s)就可以完成一个查询，但偶尔会需要40s以上(而且这种情况会持续几分钟)，当发生这种情况时，根据配置文件，TotalRawHdfsOpenFileTime 非常高，这意味着大部分时间都花在打开 HDFS 文件上。

那么可能的原因是什么以及如何解决？

最佳答案

这是打开文件所花费的时间。如果您正在查询 HDFS，这通常意味着它花费时间从名称节点获取数据。

关于hdfs - 为什么 Impala 花费大量时间打开 HDFS 文件(TotalRawHdfsOpenFileTime)？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63405856/

相关文章：

hadoop - Impala 扫描 MapR-FS 慢