apache-spark - 关于 HIVE_STATS_JDBC_TIMEOUT 的任何更新以及如何在源代码级别跳过它

标签 apache-spark hadoop hive bigdata

当我尝试对 Hive 使用 Spark-Sql 时,抛出如下错误。

Exception in thread "main" java.lang.NoSuchFieldError: HIVE_STATS_JDBC_TIMEOUT
        at org.apache.spark.sql.hive.HiveUtils$.formatTimeVarsForHiveClient(HiveUtils.scala:204)
        at org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver$.main(SparkSQLCLIDriver.scala:90)
        at org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver.main(SparkSQLCLIDriver.scala)

根据 SO 线程 hive-stats-jdbc-timeout-for-hive-queries-in-sparkspark-on-hive-sql-query-error-nosuchfielderror-hive-stats-jdbc-timeout , 当你使用特定版本的 Spark 和 Hive 时会出现此问题,实际上,如果你想使用最新版本的 spark 像 2.4.3 和最新的 Hive 像 3.1.1 ,它不能跳过。

我们可以查看此社区主题以了解详细信息,https://issues.apache.org/jira/browse/SPARK-13446 , 自 2019 年 2 月以来没有更新。

所以你知道关于这个问题的任何更新吗? 如果我们想在源代码级别自己跳过它,关于如何制作它的任何线索?

提前感谢您的帮助。

最佳答案

只有 Spark 3.0.0(尚未发布)才能支持使用 Hive 3.1.1。
吉拉 - https://jira.apache.org/jira/browse/SPARK-24360

关于apache-spark - 关于 HIVE_STATS_JDBC_TIMEOUT 的任何更新以及如何在源代码级别跳过它,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57282164/

相关文章:

java - hbase 导出到平面文件

hadoop - 如何使用逗号以外的分隔符从 hadoop(通过 hue 中的 hive)导出 csv 数据?

xml - Hive XML Serde - NULLPOINTEREXCEPTION

hadoop - newHadoopAPI中的多个输入路径可用于Spark读取Lzo文件

scala - Spark 样本太慢

apache-spark - 如何在一个微批处理的 Spark 结构化流中设置批量大小

hadoop - Elastic MapReduce 的 Post hook

hadoop - Hadoop输入拆分与 block

hadoop - 为所有节点在 hdfs 中复制数据是否更快?

python - 使用pyspark中的函数进行行操作