python - 如何在 jupyter 笔记本中运行 Spark-Submit？

我尝试在 jupyter 笔记本中运行 Spark-submit 作业以从网络数据库中提取数据:

!spark-submit --packages org.mongodb.spark:mongo-spark-connector_2.10:2.0.0 script.py

并收到此消息:

jupyter: '/home/user/script.py' is not a Jupyter command

是否有从笔记本提交的选项。

韩国

最佳答案

如果它是 ipykernel，我没有看到执行 Spark 提交的要求，您已经处于交互式 Spark 模式，其中 sparkContext 和 sqlContext 已经创建并且可用于内核启动的整个 session 。似乎您正在尝试创建级联排序操作，即在 Spark 应用程序中使用 Spark 应用程序，等等。 Spark 则无法做到这一点。

您可以启动普通的 python 内核，然后使用 Popen 或其他此类库和函数将 spark-submit 作为 shell 命令运行。

关于python - 如何在 jupyter 笔记本中运行 Spark-Submit？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46297339/

上一篇：python - 使用python删除没有子节点的xml节点

下一篇：python - 使用 matplotlib 线图的颜色图

相关文章：

python - 似乎无法初始化 Spark 上下文 (pyspark)

python - 如何将 PySpark Dataframe 转换为 R 可以在 DataBricks 中识别的内容？

python - 将Mat对象转换为标准的12x12矩阵

Python - 根据列表字典中的出现对列表中的项目进行分类

python - 矢量化 pythonic 方法来获取大于当前元素的元素数

python - Python 3.4 中 +--+ 盒子的尺寸

apache-spark - Spark聚合函数——aggregateByKey是如何工作的？

python - 获取 DataFrame 当前的分区数

apache-spark - PySpark PCA : how to convert dataframe rows from multiple columns to a single column DenseVector?

python - 如何选择具有最大值的行的所有列