azure - 直接在 Azure 中下载并解压数据集

标签 azure

我需要直接在我的 Azure 帐户中加载并解压 27 GB 数据集,以便使用带有 textFile 函数的 Spark 实例来处理它,以进行一些机器学习。我该怎么做?

我想写更多,但我花了很多时间在网上冲浪,但仍然无法取得任何有用的东西。

这是数据集:

https://academicgraphwe.blob.core.windows.net/graph-2016-02-05/index.html

最佳答案

如果直接意味着从该位置到您的虚拟机,那么我认为最简单的方法是使用 AzCopy .

例如,在您的情况下,它可以是这样的: AzCopy/来源:https://academicgraphwe.blob.core.windows.net/graph-2016-02-05//Dest:C:\myfolder/SourceKey:key/Pattern:"abc.txt"

在虚拟机上安装 AzCopy 并运行命令。您此处不需要 SourceKey,因为您的数据集看起来位于公开可用的 blob 中。但是将您的链接更改为所需位置(因为它将指向某种链接列表)。

关于azure - 直接在 Azure 中下载并解压数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36812947/

相关文章:

azure - 90 天后访问 Azure B2C 登录日志

Azure ARM - 更新管理 - VM 载入

ios - 发布时 Azure iOS SDK 错误

Azure CDN Blob 强制下载 HTML 文件而不是呈现

laravel - "The resource you are looking for has been removed, had its name changed, or is temporarily unavailable"Azure 上的 Laravel

Azure AD 将用户同步到本地 AD

azure - Windows Azure - 表服务 - 底层

azure - 具有/不具有跨区域恢复的异地冗余恢复服务保管库有什么意义?

.net - 无法解析属性 'CosmosDBAttribute.ConnectionStringSetting' 的值,但它已添加到应用程序设置中

azure - 获取Azure时间触发函数的当前函数名称