scala - HiveContext - 无法访问作为外部表映射到配置单元中的 hbase 表

标签 scala apache-spark hbase hivecontext spark-submit

我正在尝试使用 Spark 中的 HiveContext 访问 hive 中映射的 hbase 表。但是我收到了 ClassNotFoundException 异常。下面是我的代码。

import org.apache.spark.sql.hive.HiveContext
val sqlContext = new HiveContext(sc)
val df = sqlContext.sql("select * from dbn.hvehbasetable") 

我收到以下错误..

17/06/22 07:17:30 ERROR log: error in initSerDe: java.lang.ClassNotFoundException Class org.apache.hadoop.hive.hbase.HBaseSerDe not found java.lang.ClassNotFoundException: Class org.apache.hadoop.hive.hbase.HBaseSerDe not found at org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:2120) at org.apache.hadoop.hive.metastore.MetaStoreUtils.getDeserializer(MetaStoreUtils.java:385) at org.apache.hadoop.hive.ql.metadata.Table.getDeserializerFromMetaStore(Table.java:276) at org.apache.hadoop.hive.ql.metadata.Table.getDeserializer(Table.java:258) at org.apache.hadoop.hive.ql.metadata.Table.getCols(Table.java:605) at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$getTableOption$1$$anonfun$3.apply(ClientWrapper.scala:342) at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$getTableOption$1$$anonfun$3.apply(ClientWrapper.scala:337) at scala.Option.map(Option.scala:145) at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$getTableOption$1.apply(ClientWrapper.scala:337) at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$getTableOption$1.apply(ClientWrapper.scala:332) at org.apache.spark.sql.hive.client.ClientWrapper$$anonfun$withHiveState$1.apply(ClientWrapper.scala:290) at org.apache.spark.sql.hive.client.ClientWrapper.liftedTree1$1(ClientWrapper.scala:237)

任何人都可以帮助我需要导入哪个类来读取 hbase 表。

最佳答案

我认为,如果您还没有在类路径/辅助路径中添加 hive-hbase-handler jar,则需要这样做。

here 获取您的版本.

如果这有帮助,请告诉我。干杯。

关于scala - HiveContext - 无法访问作为外部表映射到配置单元中的 hbase 表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44698055/

相关文章:

scala - 使用 lift-json 删除子节点

scala - 将 Spark 数据帧转换为 Array[String]

java - HBase 表没有按预期收缩

hadoop - 在 Hbase 中获取特定的列值

hadoop - 监控 HBase 集群

scala - Idea 无法识别符号,即使它存在于外部依赖项中

Scala 对 haskell last 方法的实现

apache-spark - Spark Structured Streaming 写入流到 Hive ORC 分区的外部表

java - Spark-无法使用first()访问JavaRDD中的第一个元素

python - 通过 Okta 身份验证使用 Databricks Snowflake 连接器连接到 Snowflake