EntityFramework Core不得不注意的性能优化意外收获,你会用错?
前言
这两天在着实研究EF Core项目当中对于一些查询也没实际去检测,于是想着利用放假时间去实际测试下,结果本文就出来了,too young,too simple,后续博主会从底层翻译表达式树弄起,来从源头了解EF Core,通过本文你会明白不是EF Core团队没做性能优化,而是你根本就没用过而且正在倒退。
EntityFramework Core性能优化初探
简单粗暴直接上代码,给出上下文以及需要用到的测试类,如下:
public class EFCoreContext : DbContext { public DbSet<Blog> Blogs { get; set; } protected override void OnConfiguring(DbContextOptionsBuilder optionsBuilder) => optionsBuilder.UseSqlServer(@"Server=.;Database=EFCoreDb;Trusted_Connection=True;"); protected override void OnModelCreating(ModelBuilder modelBuilder) { modelBuilder.Entity<Blog>(pc => { pc.ToTable("Blog").HasKey(k => k.Id); pc.Property(p => p.Name).IsRequired(); pc.Property(p => p.Url).IsRequired(); pc.Property(p => p.Count).IsRequired(); pc.Property(p => p.RowVersion).IsRequired().IsRowVersion().ValueGeneratedOnAddOrUpdate(); }); } }
你是否像如下去获取分页数据呢,我们来一起瞧瞧:
var ef = new EFCoreContext(); var blogs = ef.Blogs; var example1 = blogs .Skip(1) .Take(1) .ToList(); var example2 = blogs .Skip(10) .Take(10) .ToList();
我们通过如下SQL语句来查看查询计划生成的SQL语句:
SELECT sys.syscacheobjects.cacheobjtype, sys.dm_exec_query_stats.execution_count, sys.syscacheobjects.SQL, sys.dm_exec_query_plan.query_plan FROM sys.dm_exec_query_stats INNER JOIN sys.dm_exec_cached_plans ON sys.dm_exec_cached_plans.plan_handle = sys.dm_exec_query_stats.plan_handle INNER JOIN sys.syscacheobjects ON sys.syscacheobjects.bucketid = sys.dm_exec_cached_plans.bucketid CROSS APPLY sys.dm_exec_query_plan(sys.dm_exec_query_stats.plan_handle)
结果如下:
我们再来看看xml文件中生成的SQL语句是怎样的。
这说明什么问题呢,上述查询计划中生成的SQL语句对于我们上述去取数据首选从第二条取一条,接下来是去取第十条后的十条,同时上述SQL语句而是声明了两个变量,换言之,上述两条语句查询最终在第一次查询后SQL查询计划进行了缓存,下次再去取数据时直接调用此SQL语句以此达到重用的目的,下面要是我们进行如下改造,结果会怎样呢?
var ef = new EFCoreContext(); var blogs = ef.Blogs; var count = 1; var example1 = blogs .Skip(count) .Take(count) .ToList(); count = 10; var example2 = blogs .Skip(count) .Take(count) .ToList();
结果经过上述改造利用变量的形式和直接赋值的形式是一致的,没有什么可讲的,下面我们再来讲述另外一种情况。请继续往下看。
var ef = new EFCoreContext(); var blogs = ef.Blogs; var skipTakeWithInt1 = blogs .OrderBy(b => b.Id).Where(d => d.Name.Length > 1).ToList(); var skipTakeWithInt2 = blogs .OrderBy(b => b.Id).Where(d => d.Name.Length > 10).ToList();
看出什么没有,对于上述两条查询则是对应进行了两次SQL查询,这下意识到了其中玄机了吧,下面我们将上述再改造一下:
var ef = new EFCoreContext(); var blogs = ef.Blogs; var length = 1; var skipTakeWithVariable1 = blogs .OrderBy(b => b.Id).Where(d => d.Name.Length > length).ToList(); length = 10; var skipTakeWithVariable2 = blogs .OrderBy(b => b.Id).Where(d => d.Name.Length > length).ToList();
我们利用变量替换值改造后结果生成的SQL语句与上述截然不同,这里同样是声明了长度的变量,你发现没该变量居然和我们声明的变量长度是一致的,有点神奇,如此这样通过变量替换值得方式来达到SQL查询计划重用的目的,说到这里,我们是不是应该回答一下为什么会有这样的情况发生呢。很多东西当你一直没用到时就觉得不会用到压根不用学,其实不然,比如这样,其本质到底是怎样的呢,其实是因为前面我已经讲过【闭包】的原因。
lambda表达式对我们声明的变量进行了捕获然后延长了其生命周期,也就是说将变量类似变成类中一个字段了,类似如下:
[CompilerGenerated] public sealed class ExampleClass1 { public int Length; } [CompilerGenerated] public sealed class ExampleClass2 { public int Length; }
自动编译生成两个类同时存在两个对于长度的字段。接下来当我们利用变量进行查询就演变了如下这样:
var ef = new EFCoreContext(); var blogs = ef.Blogs; var length = 1; var example1 = new ExampleClass1() { Length = length }; var skipTakeWithVariable1 = blogs .OrderBy(b => b.Id).Where(d => d.Name.Length > example1.Length).ToList(); length = 10; var example2 = new ExampleClass2() { Length = length }; var skipTakeWithVariable2 = blogs .OrderBy(b => b.Id).Where(d => d.Name.Length > example2.Length).ToList();
这样就很明了了为什么通过变量达到查询计划重用的目的。
总结
关于EntityFramework Core虽然目前设计的性能非常好,但是有些东西等我们去用时还得多加验证,看其背后的本质是怎样的,才能不会心生疑窦,到底该怎样用,如何用,心中要有定数才是,一点一滴的细小优化不注意最终将导致大意失荆州。接下来博主会在三个方向不定时更新博客,第一个是SQL Server性能优化系列,第二个是ASP.NET Core MVC/WebAPi,第三个则是EntityFramework Core原理解析,敬请期待。