azure - hdinsight actionscript 安装 spark 1.2

标签 azure hadoop apache-spark hdfs azure-hdinsight

有谁知道如何为 hdisights 创建 ActionScript ?我现在正在使用 actoinscript 安装 spark 1.0.2,但希望集群上的 spark 1.2.x 获得更多的配置单元支持。我读过 Script Action Development with HDInsight当我尝试通过修改 Microsoft 提供的 actionscript 使用 1.2 创建 spark 集群时。这样做之后我得到一个错误,spark 不理解文件 url 'wasb://' 并且它需要采用 'hdfs://' 格式。在文章中它谈到了 Configure the custom components to use WASB它说:

The custom components that you install on the cluster nodes might have a 
default configuration to use HDFS storage. You should change the 
configuration to use Azure Storage Blob (WASB) instead. On a cluster 
re-image, the HDFS file system gets formatted and you would lose any data 
that is stored there. Using WASB instead ensures that your data will be 
retained.

这对我来说似乎是在谈论我遇到的错误。有谁知道如何编译支持(WASB)的spark或如何配置它?

最佳答案

好吧,微软在昨天看起来像是为 Apache Spark 1.2 添加了“支持”。如果你使用新版本的 HDInsight 3.2 并使用这个 new action script它看起来为您安装 1.2。我现在正在测试它!

关于azure - hdinsight actionscript 安装 spark 1.2,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28460605/

相关文章:

sql - Azure SQL Powershell,如何读取数据 View

java - 在Java中根据时间戳获取HDFS文件

使用子进程 hdfs "cat: Illegal file pattern: Illegal character range near index 11"打开 Python HDFS 文件

scala - spark RDD折叠方法的解释

scala - 左反加入Spark?

scala - 如何从分组数据中获取 Spark 数据帧

php - 将 Azure 表存储实体转换为 JSON

azure - 如何使用 EventGrids BlobCreated 事件数据中的 URL 获取 Blob 的路径?

Azure 函数本地 (CLI) 与云 dll 不匹配

java - 通过 HADOOP 将数据插入 HIVE