hadoop - 如何分别从tarball安装Spark和Hadoop [Cloudera]

标签 hadoop apache-spark cloudera cloudera-cdh spark-streaming

我想使用tarball安装Hadoop和Spark的Cloudera发行版。
我已经在本地计算机上以伪分布式模式设置了Hadoop,并成功运行了一个Yarn示例。

我已经从here下载了最新的tarball CDH 5.3.x

但是从Cloudera下载的Spark的文件夹结构与Apache网站不同。这可能是因为Cloudera提供了自己维护的版本。

因此,由于没有找到任何文档,我没有单独从Cloudera的tarball安装Spark。
有人可以帮助我了解如何做吗?

最佳答案

Spark可以提取到任何目录。您只需要运行带有必需参数的./bin/spark-submit命令(在解压缩的spark目录中可用)即可提交作业。要启动Spark交互式 shell ,请使用命令./bin/spark-shell

关于hadoop - 如何分别从tarball安装Spark和Hadoop [Cloudera],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28858598/

相关文章:

eclipse-plugin - hadoop 的 eclipse 插件是否与 CDH3 一起工作

hadoop - 名称节点 HA (UnknownHostException : nameservice1)

hadoop - 如何在 Mac OS X Lion 上安装 Cloudera Hue?

hadoop - pyspark.sql.utils.IllegalArgumentException : u'java.net.UnknownHostException: 用户'

hadoop - Spark saveAsTextFile 创建目录

java - 在spark java api(org.apache.spark.SparkException)中使用filter(),map(),...时出错

scala - 在 APACHE SPARK 中通过 KryoSerializer 和 JavaSerializer 使用 Scala Pickling 序列化

hadoop - Cloudera Manager 有什么替代方案吗? (CDH)

java - 错误 : java. lang.NumberFormatException:对于输入字符串: "100"

apache-spark - 在Kerberos化Hadoop环境中启用了Spark并启用了高可用性:Spark SQL仅在写入任务后才能读取数据