c# - Entity Framework 性能问题

标签 c# .net entity-framework entity-framework-4.1 performance-testing

我在使用 Entity Framework 时遇到了一个有趣的性能问题。我正在使用 Code First。

这是我的实体的结构:

一本书可以有很多评论。 评论与一本书相关联。 评论可以有一个或多个评论。 一条评论与一条评论相关联。

public class Book
{
    public int BookId { get; set; }
    // ...
    public ICollection<Review> Reviews { get; set; }
}

public class Review 
{
    public int ReviewId { get; set; }
    public int BookId { get; set; }
    public Book Book { get; set; }
    public ICollection<Comment> Comments { get; set; }
}

public class Comment
{
     public int CommentId { get; set; }
     public int ReviewId { get; set; }
     public Review Review { get; set; }
}

我用大量数据填充了我的数据库并添加了适当的索引。我正在尝试使用以下查询检索一本有 10,000 条评论的书:

var bookAndReviews = db.Books.Where(b => b.BookId == id)
                       .Include(b => b.Reviews)
                       .FirstOrDefault();

这本书有 10,000 条评论。此查询的性能约为 4 秒。运行完全相同的查询(通过 SQL Profiler)实际上会立即返回。我使用相同的查询和一个 SqlDataAdapter 以及自定义对象来检索数据,它发生在不到 500 毫秒内。

使用 ANTS Performance Profiler 看起来大部分时间都花在做几件不同的事情上:

Equals 方法被调用了 5000 万次。

有谁知道为什么它需要调用 5000 万次以及我该如何提高性能?

最佳答案

Why is Equals called 50M times?

听起来很可疑。您有 10.000 条评论和 50.000.000 次调用 Equals。假设这是由 EF 内部实现的标识映射引起的。 Identity map 确保每个具有唯一键的实体仅被上下文跟踪一次,因此如果上下文已经具有与从数据库加载的记录具有相同键的实例,它将不会具体化新实例,而是使用现有实例。现在这怎么能与那些数字重合呢?我的可怕猜测:

=============================================
1st      record read   |  0     comparisons
2nd      record read   |  1     comparison
3rd      record read   |  2     comparisons
...
10.000th record read   |  9.999 comparisons

这意味着每条新记录都与身份映射中的每条现有记录进行比较。通过应用数学来计算所有比较的总和,我们可以使用称为“算术序列”的东西:

a(n) = a(n-1) + 1
Sum(n) = (n / 2) * (a(1) + a(n))
Sum(10.000) = 5.000 * (0 + 9.999) => 5.000 * 10.000 = 50.000.000

希望我的假设或计算没有出错。等待!我希望我做错了,因为这看起来不太好。

尝试关闭更改跟踪 = 希望关闭身份映射检查。

这可能很棘手。开始于:

var bookAndReviews = db.Books.Where(b => b.BookId == id)
                             .Include(b => b.Reviews)
                             .AsNoTracking()
                             .FirstOrDefault();

但是很有可能您的导航属性不会被填充(因为它是由更改跟踪处理的)。在这种情况下使用这种方法:

var book = db.Books.Where(b => b.BookId == id).AsNoTracking().FirstOrDefault();
book.Reviews = db.Reviews.Where(r => r.BookId == id).AsNoTracking().ToList();

无论如何,你能看出传递给 Equals 的对象类型是什么吗?我认为它应该只比较主键,甚至 50M 整数比较不应该是这样的问题。

作为旁注,EF 很慢 - 这是众所周知的事实。它还在具体化实体时在内部使用反射,因此仅 10.000 条记录就可能需要“一些时间”。除非您已经这样做,否则您还可以关闭动态代理创建 (db.Configuration.ProxyCreationEnabled)。

关于c# - Entity Framework 性能问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7403149/

相关文章:

c# - NHibernate分层递归查询

c# - 关闭从 Canvas 渲染的黑白位图的抗锯齿

c# - Entity Framework 中的模型跟踪

c# - C# 中的 Promisify/async-await 回调

c# - MySql.Data 版本的 MySqlBackup.NET 问题

asp.net - 如何使用 ASP.Net/MVC 5/EF 编写拍卖网站代码

c# - 如何在 MVC4 的 UserProfile 中创建自定义附加字段

c# - Entity Framework ..如何映射自引用外键..例如类别有很多类别

c# - Windows Phone 8 生活磁贴使用标题向用户显示一些信息

c# - FluentNHibernate 无法从 web.config 中读取 connectionString