c# - 将文件批量上传到 Azure 的最快方法 (C#)

标签 c# .net azure azure-storage azure-blob-storage

批量上传文件最快的方法是什么 Azure Blob Storage ?我尝试了两种方法,syncasync上传,async显然是最快的,但我想知道是否有更好的方法?是否有内置支持批量上传?我在文档中找不到任何内容,但可能会错过它。

这是我运行的测试:

static void Main(string[] args)
{
    int totalFiles = 10; //10, 50, 100
    byte[] randomData = new byte[2097152]; //2mb
    for (int i = 0; i < randomData.Length; i++)
    {
        randomData[i] = 255;
    }

    CloudStorageAccount cloudStorageAccount = CloudStorageAccount.Parse(ConfigurationManager.AppSettings["StorageConnectionString"]);
    var blobClient = cloudStorageAccount.CreateCloudBlobClient();

    var container = blobClient.GetContainerReference("something");
    container.CreateIfNotExists();


    TimeSpan tsSync = Test1(totalFiles, randomData, container);
    TimeSpan tsAsync = Test2(totalFiles, randomData, container);

    Console.WriteLine($"Sync: {tsSync}");
    Console.WriteLine($"Async: {tsAsync}");

    Console.ReadLine();

}

public static TimeSpan Test2(int total, byte[] data, CloudBlobContainer container)
{
    Stopwatch sw = new Stopwatch();
    sw.Start();
    Task[] tasks = new Task[total];
    for (int i = 0; i < total; i++)
    {
        CloudBlockBlob blob = container.GetBlockBlobReference(Guid.NewGuid().ToString());
        tasks[i] = blob.UploadFromByteArrayAsync(data, 0, data.Length);

    }
    Task.WaitAll(tasks);


    sw.Stop();
    return sw.Elapsed;
}

public static TimeSpan Test1(int total, byte[] data, CloudBlobContainer container)
{
    Stopwatch sw = new Stopwatch();
    sw.Start();
    for (int i = 0; i < total; i++)
    {
        CloudBlockBlob blob = container.GetBlockBlobReference(Guid.NewGuid().ToString());
        blob.UploadFromByteArray(data, 0, data.Length);

    }
    sw.Stop();
    return sw.Elapsed;
}

输出是:

10 个文件

Sync: 00:00:08.7251781
Async: 00:00:04.7553491
DMLib: 00:00:05.1961654

Sync: 00:00:08.1169861
Async: 00:00:05.2384105
DMLib: 00:00:05.4955403

Sync: 00:00:07.6122464
Async: 00:00:05.0495365
DMLib: 00:00:06.4714047

50 个文件

Sync: 00:00:39.1595797
Async: 00:00:22.5757347
DMLib: 00:00:25.2897623

Sync: 00:00:40.4932800
Async: 00:00:22.3296490
DMLib: 00:00:26.0631829

Sync: 00:00:39.2879245
Async: 00:00:24.0746697
DMLib: 00:00:26.9243116

我希望这对 SO 来说是一个有效的问题。

谢谢

编辑:

我已经使用“DMLib”测试更新了结果,以响应迄今为止给出的答案。 DMLib 是一个没有配置更改的测试(见上文),没有性能提升

按照文档的建议,我使用 ServicePointManager.DefaultConnectionLimit = Environment.ProcessorCount * 8; 运行了更多测试,这大大提高了上传速度,但也提高了我的异步方法。到目前为止,DMlib 还没有给我带来任何值得的性能提升。我通过下面的配置更改添加了第二组测试结果。

我还设置了 ServicePointManager.Expect100Continue = false; 但这对速度没有影响。

测试结果 ServicePointManager.DefaultConnectionLimit = Environment.ProcessorCount * 8;

10 个文件

Sync: 00:00:07.6199307
Async: 00:00:02.9615565
DMLib: 00:00:02.6629716

Sync: 00:00:08.7721797
Async: 00:00:02.8246599
DMLib: 00:00:02.7281091

Sync: 00:00:07.8437682
Async: 00:00:03.0171246
DMLib: 00:00:03.0190045

50 个文件

Sync: 00:00:40.2395863
Async: 00:00:10.3157544
DMLib: 00:00:10.5107740

Sync: 00:00:40.2473358
Async: 00:00:10.8190161
DMLib: 00:00:10.2585441

Sync: 00:00:41.2646137
Async: 00:00:13.7188085
DMLib: 00:00:10.8686173

我是否错误地使用了该库,因为它似乎没有提供比我自己的方法更好的性能。

最佳答案

请使用Azure Storage Data Movement Library ,这是AzCopy的核心。这个库正是解决您问题的工具。 :)

关于c# - 将文件批量上传到 Azure 的最快方法 (C#),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37386073/

相关文章:

c# - 如何计算可用磁盘空间?

C#:代码契约与普通参数验证

azure - 在azure虚拟机Windows 10上安装docker

c# - Selenium 2 测试 Javascript

订阅域事件时的 C# AppDomain 沙箱安全异常

c# - 是否可以从 Visual Studio 中复制代码并将格式化的代码粘贴到 OneNote 中?

azure - 在 botframework-sdk 中,我的机器人突然开始出现此错误 Error : Get Token request returned http error: 401

c# - 在 ASP.NET Core 中使用 Azure Active Directory B2C 在 Web API 中测试云身份验证 - 返回错误 "invalid_request"

c# - 使用 LINQ 枚举的正确方法是什么?

c# - Azure AD 授权错误 AuthenticationFailed : IDX10501: Signature validation failed. 无法匹配 'kid'