apache-spark - 为什么在 Spark-Shell 中导入 SparkSession 失败并显示 "object SparkSession is not a member of package org.apache.spark.sql"？

标签 apache-spark cloudera-cdh apache-spark-1.6

我在我的虚拟机 Cloudera 机器上使用 Spark 1.6.0。

我正在尝试从 Spark shell 将一些数据输入到 Hive 表中。为此，我尝试使用 SparkSession。但下面的导入不起作用。

scala> import org.apache.spark.sql.SparkSession
<console>:33: error: object SparkSession is not a member of package org.apache.spark.sql
         import org.apache.spark.sql.SparkSession

如果没有这个，我就无法执行这个语句:

val spark = SparkSession.builder.master("local[2]").enableHiveSupport().config("hive.exec.dynamic.partition","true").config("hive.exec.dynamic.partition.mode", "nonstrict").config("spark.sql.warehouse.dir", warehouseLocation).config("hive.metastore.warehouse.dir","/user/hive/warehouse").getOrCreate()
<console>:33: error: not found: value SparkSession
         val spark = SparkSession.builder.master("local[2]").enableHiveSupport().config("hive.exec.dynamic.partition","true").config("hive.exec.dynamic.partition.mode", "nonstrict").config("spark.sql.warehouse.dir", warehouseLocation).config("hive.metastore.warehouse.dir","/user/hive/warehouse").getOrCreate()

谁能告诉我我在这里犯了什么错误？

最佳答案

SparkSession is available as of Spark 2.0因此您应该改用 SQLContext (或将您的 Spark 升级到最新最好的 2.1.1 )。

引用 Spark 1.6.0 的 Starting Point: SQLContext :

The entry point into all functionality in Spark SQL is the SQLContext class, or one of its descendants.

In addition to the basic SQLContext, you can also create a HiveContext, which provides a superset of the functionality provided by the basic SQLContext.

关于apache-spark - 为什么在 Spark-Shell 中导入 SparkSession 失败并显示 "object SparkSession is not a member of package org.apache.spark.sql"？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44772397/

上一篇：angular - Module路由路径延迟加载问题

下一篇：r - Knit 和父子 R 代码块 : A child's chunk can't recognize parent's variables within loop

相关文章：

scala - 将 UDF 传递给方法或类

hadoop - 在哪里可以找到CDH及其所有软件版本？

hadoop - 有没有办法用带参数的sql脚本运行impala shell？

apache-spark - KMeans 与 Spark 1.6.2 VS Spark 2.0.0

python - 与 Spark 交互的 REST API

python - 用于建议新友谊的 Spark 计算

apache-spark - 获取 Pyspark Dataframe 的 nlargest 值的更有效方法

hadoop - 集群安装卡在cloudera manager中的 "installation in progress"

scala - 如何替换 Vector 列中的空值？

scala dataframe 过滤字符串数组