c# - Count 或 Skip(1).Any() 我想知道是否有超过 1 条记录的地方 - Entity Framework

标签 c# sql-server linq entity-framework tsql

我不确定是什么时候,但我读了一篇关于此的文章,其中指出 Skip(1).Any() 的用法优于 Count()使用 Entity Framework 时的同情心(我可能记错了)。在看到生成的 T-SQL 代码后,我不确定这一点。

这是第一个选项:

int userConnectionCount = _dbContext.HubConnections.Count(conn => conn.UserId == user.Id);
bool isAtSingleConnection = (userConnectionCount == 1);

这会生成以下合理的 T-SQL 代码:

SELECT 
[GroupBy1].[A1] AS [C1]
FROM ( SELECT 
  COUNT(1) AS [A1]
    FROM [dbo].[HubConnections] AS [Extent1]
    WHERE [Extent1].[UserId] = @p__linq__0
)  AS [GroupBy1]

这是另一个选项,据我所知这是建议的查询:

bool isAtSingleConnection = !_dbContext
    .HubConnections.OrderBy(conn => conn.Id)
    .Skip(1).Any(conn => conn.UserId == user.Id);

这是为上述 LINQ 查询生成的 T-SQL:

SELECT 
CASE WHEN ( EXISTS (SELECT 
    1 AS [C1]
    FROM ( SELECT [Extent1].[Id] AS [Id], [Extent1].[UserId] AS [UserId]
        FROM ( SELECT [Extent1].[Id] AS [Id], [Extent1].[UserId] AS [UserId], row_number() OVER (ORDER BY [Extent1].[Id] ASC) AS [row_number]
            FROM [dbo].[HubConnections] AS [Extent1]
        )  AS [Extent1]
        WHERE [Extent1].[row_number] > 1
    )  AS [Skip1]
    WHERE [Skip1].[UserId] = @p__linq__0
)) THEN cast(1 as bit) WHEN ( NOT EXISTS (SELECT 
    1 AS [C1]
    FROM ( SELECT [Extent2].[Id] AS [Id], [Extent2].[UserId] AS [UserId]
        FROM ( SELECT [Extent2].[Id] AS [Id], [Extent2].[UserId] AS [UserId], row_number() OVER (ORDER BY [Extent2].[Id] ASC) AS [row_number]
            FROM [dbo].[HubConnections] AS [Extent2]
        )  AS [Extent2]
        WHERE [Extent2].[row_number] > 1
    )  AS [Skip2]
    WHERE [Skip2].[UserId] = @p__linq__0
)) THEN cast(0 as bit) END AS [C1]
FROM  ( SELECT 1 AS X ) AS [SingleRowTable1];

这里哪一个是正确的方法?这两者之间有很大的性能差异吗?

最佳答案

查询性能取决于很多因素,例如存在的索引、实际数据、关于存在数据的统计信息的陈旧程度等。SQL 查询计划优化器会查看这些不同的指标以提出高效的查询计划。因此,任何说查询 1 总是比查询 2 或相反的直接答案都是不正确的。

就是说,我在下面的回答试图解释文章的立场,以及 Skip(1).Any() 如何(稍微)比 Count() > 1。第二个查询虽然更大而且几乎不可读,但看起来可以以高效的方式进行解释。同样,这取决于上述事项。这个想法是,在 Count() 的情况下,数据库必须查看更多的行数才能计算出结果。在计数情况下,假设存在所需的索引(Id 上的聚簇索引以使第二种情况下的 OrderBy 有效),数据库必须经过计数行数。在第二种情况下,它必须经过最多两行才能得出答案。

让我们的分析更加科学,看看我的上述理论是否站得住脚。为此,我正在创建一个虚拟客户数据库。客户类型如下所示,

public class Customer
{
    public int ID { get; set; }
    public string Name { get; set; }
    public int Age { get; set; }
}

我正在使用这段代码为数据库添加大约 10 万行随机行(我真的必须证明这一点),

    for (int j = 0; j < 100; j++)
    {
        using (CustomersContext db = new CustomersContext())
        {
            Random r = new Random();
            for (int i = 0; i < 1000; i++)
            {
                Customer c = new Customer
                {
                    Name = Guid.NewGuid().ToString(),
                    Age = r.Next(0, 100)
                };
                db.Customers.Add(c);
            }
            db.SaveChanges();
        }
    }

示例代码 here .

现在,我要使用的查询如下,

db.Customers.Where(c => c.Age == 26).Count() > 1; // scenario 1

db.Customers.Where(c => c.Age == 26).OrderBy(c => c.ID).Skip(1).Any() // scenario 2

我已经启动了 SQL 探查器来捕获查询计划。捕获的计划如下所示,

场景一:

查看上图中方案 1 的估计成本和实际行数。 Scenario 1 - Estimated Cost Scenario 1 - Actual row count

场景 2:

在下图中查看方案 2 的估计成本和实际行数。 Scenario 2 - Estimated Cost Scenario 2 - Actual row count

根据最初的猜测,与 Count 情况相比,Skip 和 any 情况下的估计成本和行数要少。

结论:

除了所有这些分析,正如许多其他人之前评论的那样,这些不是您应该尝试在代码中进行的性能优化。诸如此类的事情会以非常小的(我会说不存在的)性能优势损害可读性。我做这个分析只是为了好玩,绝不会以此作为选择场景 2 的基础。我会测量并查看执行 Count() 是否真的会伤害更改代码以使用 跳过()。任何()

关于c# - Count 或 Skip(1).Any() 我想知道是否有超过 1 条记录的地方 - Entity Framework ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16193331/

相关文章:

c# - .First 不会在空集合上抛出异常

c# - 何时使用扩展方法?

c# - ReadOnlySequence – 切片到给定的 SequencePosition + 1

sql - 使用 SQL 克隆数据库中表示的树结构

sql-server - 使用 T-SQL 中行的前一个值计算值

c# - 包括派生模型相关类

c# - 为什么 CaSTLe Windsor 拦截器会破坏 C# 动态对象上方法的运行时绑定(bind)?

c# - Unity C# - 将内置数组添加到列表

sql - INNER JOIN 与 INNER JOIN (SELECT . FROM)

c# - 有没有更好的方法来组合这两个 Linq 表达式?