C# 异步/等待读取 DbDataReader 的效率(或滥用)

偶然发现了一段相对常用的代码，起初看起来效率很低。 (我知道有时优化可能是邪恶的，但我想知道)

介绍部分 - 相当简单的 SP 执行 + 读取返回的数据:

try
{
    await connection.OpenAsync();
    using (var command = connection.CreateCommand())
    {
        command.CommandText = sql.ToString();
        command.Parameters.AddRange(sqlParameters.ToArray());

        var reader = await command.ExecuteReaderAsync();
        if (reader.HasRows)
        {
            while (await reader.ReadAsync())
            {
                 var item = await GetProjectElement(reader);
                 list.Add(item);
            }
         }

         reader.Dispose();
     }      
}
finally
{
    connection.Close();
}

我担心的是功能

await GetProjectElement(reader)

private async Task<Project> GetProjectElement(DbDataReader reader)
{
    var item = new Project
    {
        Id = await reader.GetFieldValueAsync<int>(1),
        ParentId = await reader.IsDBNullAsync(2) ? default(int?) : await reader.GetFieldValueAsync<int>(2),
        Name = await reader.IsDBNullAsync(3) ? default(string) : await reader.GetFieldValueAsync<string>(3),
        Description = await reader.IsDBNullAsync(4) ? default(string) : await reader.GetFieldValueAsync<string>(4),
        Address = await reader.IsDBNullAsync(5) ? default(string) : await reader.GetFieldValueAsync<string>(5),
        City = await reader.IsDBNullAsync(6) ? default(string) : await reader.GetFieldValueAsync<string>(6),
        PostalCode = await reader.IsDBNullAsync(7) ? default(string) : await reader.GetFieldValueAsync<string>(7),
        Type = (ProjectTypeEnum)(await reader.GetFieldValueAsync<byte>(8)),
        StartDate = await reader.IsDBNullAsync(9) ? default(DateTime?) : await reader.GetFieldValueAsync<DateTime>(9),
        EstimatedEndDate = await reader.IsDBNullAsync(10) ? default(DateTime?) : await reader.GetFieldValueAsync<DateTime>(10),
        ActualEndDate = await reader.IsDBNullAsync(11) ? default(DateTime?) : await reader.GetFieldValueAsync<DateTime>(11),
        WebsiteUrl = await reader.IsDBNullAsync(12) ? default(string) : await reader.GetFieldValueAsync<string>(12),
        Email = await reader.IsDBNullAsync(13) ? default(string) : await reader.GetFieldValueAsync<string>(13),
        PhoneNumber = await reader.IsDBNullAsync(14) ? default(string) : await reader.GetFieldValueAsync<string>(14),
        MobilePhoneNumber = await reader.IsDBNullAsync(15) ? default(string) : await reader.GetFieldValueAsync<string>(15),
        Key = await reader.IsDBNullAsync(16) ? default(Guid?) : await reader.GetFieldValueAsync<Guid>(16),
        OrganizationElementId = await reader.GetFieldValueAsync<int>(17),
        CompanyOrganizationElementId = await reader.IsDBNullAsync(18) ? default(int?) : await reader.GetFieldValueAsync<int>(18),
        IsArchived = await reader.GetFieldValueAsync<bool>(20),
        IsDeleted = await reader.GetFieldValueAsync<bool>(21),
        CreatedOn = await reader.GetFieldValueAsync<DateTime>(22),
        CreatedBy = await reader.GetFieldValueAsync<string>(23),
        ModifiedOn = await reader.IsDBNullAsync(24) ? default(DateTime?) : await reader.GetFieldValueAsync<DateTime>(24),
        ModifiedBy = await reader.IsDBNullAsync(25) ? default(string) : await reader.GetFieldValueAsync<string>(25)
    };

    return item;
}

如您所见，有很多等待调用被编译器转换为状态机，不是吗？

您可以找到编译器生成代码的简化版本 here . 大量 GOTO，这意味着上下文会一遍又一遍地切换。

由于 SP 是在没有指定 CommandBehavior 的情况下执行的 - 数据将处于非顺序模式。 (可能的原因是对于 Project link 的这种情况，表格行的字节数不应该很大)

我的问题是:

1) 这是在没有明显原因的情况下滥用 async/await，因为行数据已经缓冲在内存中，对吗？

2) 是 Task<Project>在这种情况下是纯开销吗？

3) 与没有 await 的方法相比，这种方法的性能实际上会更差吗？正在

最后的想法:如果我做对了，我们会想对内容可能超过合理长度的大表行使用 CommandBehavior.SequentialAccess，从而使我们想要异步读取它？ (比如存储 varbinary(max) 或 blob)

最佳答案

正如其他人所指出的，GOTO 不会导致上下文切换，而且速度非常快。

1) is this abusing of the async/await without an obvious reason, because the row data is already buffered in memory, right?

ADO.NET 允许实现者在实现基类型的确切方式上有很大的余地。也许该行在内存中，也许不在。

2) is Task a pure overhead in this scenario?

是的，如果操作实际上是同步的。这是您的 ADO.NET 提供程序的实现细节。

注意状态机和await这里几乎不增加任何开销；有一个async fast path如果可能，代码只是保持同步执行。

3) would this approach actually have a worse performance compared to one without awaiting

可能不会。首先，性能影响不会受到调用每个方法并继续同步执行所完成的少量 CPU 工作的驱动。您看到的任何性能影响都是由于额外的 Task<T>实例扔到 Gen0 堆上，必须进行垃圾回收。这就是现在有 ValueTask<T> 的原因.

但即使是这种性能影响也很可能在对数据库服务器的网络 I/O 调用旁边不明显。也就是说，如果您想了解微观性能损失，Zen of Async是经典。

关于C# 异步/等待读取 DbDataReader 的效率(或滥用)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54217004/

C# 异步/等待读取 DbDataReader 的效率(或滥用)

上一篇：C# 异步任务 <IActionResult> 返回对象

下一篇：c# - HTML 解析器。加载文件或程序集失败