性能注意事项(实体框架)

.NET Framework (current version)
 
其他版本
 
 

本主题介绍 ADO.NET 实体框架的性能特征,并提供一些注意事项帮助改善实体框架应用程序的性能。

为了更好地了解查询在实体框架中的性能,了解当查询针对概念模型执行并将数据作为对象返回时发生的操作将很有帮助。 下表描述这一系列操作。

操作

相对成本

频率

注释

加载元数据

中等

在每个应用程序域中一次。

实体框架使用的模型和映射元数据加载到 MetadataWorkspace 中。 此元数据全局缓存,并可用于同一个应用程序域中的其他 ObjectContext 实例。

打开数据库连接

中等1

根据需要。

由于打开与数据库之间的连接会占用宝贵的资源,因此,Entity Framework只视需要打开和关闭数据库连接。 还可以显式打开连接。 有关详细信息,请参阅Managing Connections and Transactions

生成视图

在每个应用程序域中一次。(可以预生成。)

在实体框架可以针对概念模型执行查询或将更改保存到数据源之前,它必须生成一组本地查询视图才能访问数据库。 由于生成这些视图会产生很高的成本,因此,您可以在设计时预生成视图并将它们添加到项目。 有关详细信息,请参阅How to: Pre-Generate Views to Improve Query Performance

准备查询

中等2

每个唯一查询一次。

包括编写查询命令、基于模型和映射元数据生成命令树和定义所返回数据的形状的成本。 因为实体 SQL查询命令和 LINQ 查询现已缓存,所以,以后执行相同查询所需的时间较少。 您仍可以使用已编译的 LINQ 查询来降低后续执行中的这一开销,编译的查询比自动缓存的 LINQ 查询效率更高。 有关详细信息,请参阅已编译的查询 (LINQ to Entities)。 有关 LINQ 查询执行的常规信息,请参见 LINQ to Entities

System_CAPS_note说明

不自动缓存将 Enumerable.Contains 运算符应用到内存中集合的 LINQ to Entities 查询。 此外,不允许在已编译的 LINQ 查询中参数化内存中的集合。

执行查询

2

每个查询一次。

使用 ADO.NET 数据提供程序对数据源执行命令的成本。 因为大多数数据源缓存查询计划,所以,以后执行相同查询所需的时间可能较少。

加载和验证类型

3

每个 ObjectContext 实例一次。

将加载类型,并针对概念模型定义的类型对其进行验证。

跟踪

3

对于查询返回的每个对象执行一次。 4

如果查询使用 NoTracking 合并选项,则此阶段不影响性能。

如果查询使用 AppendOnlyPreserveChanges 或 OverwriteChanges 合并选项,则将在 ObjectStateManager 中跟踪查询结果。 将为查询返回的每个跟踪对象生成一个 EntityKey,并用于在 ObjectStateManager 中创建 ObjectStateEntry。 如果对于 EntityKey 可以找到现有 ObjectStateEntry,则返回现有对象。 如果使用 PreserveChanges 或 OverwriteChanges选项,则首先更新对象,然后返回此对象。

有关详细信息,请参阅Identity Resolution, State Management, and Change Tracking

使对象具体化

中等3

对于查询返回的每个对象执行一次。 4

读取返回的 DbDataReader 对象、创建对象以及设置属性值(这些值基于 DbDataRecord 类的每个实例中的值)的过程。 如果对象已存在于 ObjectContext 中且查询使用 AppendOnly 或 PreserveChanges 合并选项,则此阶段不影响性能。 有关详细信息,请参阅Identity Resolution, State Management, and Change Tracking

1 当数据源提供程序实现连接池时,将跨整个池分布打开连接的成本。 SQL Server 的 .NET 提供程序支持连接池。

2 成本随着查询复杂性增加而上升。

3 总成本随着查询返回的对象数目成比例上升。

4 EntityClient 查询不需要此系统开销,因为 EntityClient 查询返回 EntityDataReader 而非对象。 有关详细信息,请参阅用于实体框架的 EntityClient 提供程序

下面是可能影响实体框架应用程序的性能的其他注意事项。

因为查询可能消耗大量资源,所以请考虑一下在代码中的哪个点以及在哪台计算机上执行查询。

当您创建 ObjectQuery<T> 或 LINQ 查询时,查询可能并不立即执行。 查询延迟执行,直到您需要结果,例如,在 foreach (C#) 或 For Each (Visual Basic) 枚举期间或当分配此查询以填充 List<T> 集合时。 当您对 ObjectQuery<T> 调用 Execute 方法时,或当您调用返回单一查询(如 First<TSource> 或 Any<TSource>)的 LINQ 方法时,将立即开始执行查询。 有关更多信息,请参见Object Queries查询执行 (LINQ to Entities)

尽管 LINQ 查询执行发生在承载数据源的计算机上,但 LINQ 查询的某些部分可能在客户端计算机上进行计算。 有关更多信息,请参见查询执行 (LINQ to Entities) 的“存储执行”部分。

实体模型中各个查询以及映射的复杂性对查询性能具有重大影响。

比概念模型中实体之间和存储模型中表之间的简单一对一映射更复杂的模型与具有一对一映射的模型相比,前者将生成更复杂的命令。

在针对数据源执行的命令或返回大量数据的命令中需要大量联接的查询可能会在以下几个方面影响性能:

  • 看似简单的针对概念模型的查询可能导致对数据源执行更复杂的查询。 因为实体框架将针对概念模型的查询转换为针对数据源的等效查询,所以可能发生上述情况。 当概念模型中的单个实体集映射到数据源中的多个表时,或当实体之间的关系映射到联接表时,针对数据源查询执行的查询命令可能需要一个或多个联接。

    System_CAPS_note说明

    使用 ObjectQuery<T> 或 EntityCommand 类的 ToTraceString 方法可以查看针对给定查询的数据源执行的命令。 有关详细信息,请参阅How to: View the Store Commands

  • 嵌套的 Entity SQL 查询可能在服务器上创建联接,并可能返回大量的行。

    下面是投影子句中嵌套查询的示例:

     
     
    SELECT c, (SELECT c, (SELECT c FROM AdventureWorksModel.Vendor AS c  ) As Inner2 
        FROM AdventureWorksModel.JobCandidate AS c  ) As Inner1 
        FROM AdventureWorksModel.EmployeeDepartmentHistory AS c
    

    此外,此类查询还会导致查询管道生成单个查询并在各嵌套查询间复制对象。 因此,单一列可能会复制多次。 在某些数据库(包括 SQL Server)中,这可能导致 TempDB 表增长过大,而降低服务器性能。 当执行嵌套查询时,应务必小心。

  • 如果客户端执行的操作所消耗的资源与结果集的大小成正比,则返回大量数据的任何查询都可能导致性能下降。 在此类情况下,应考虑限制查询返回的数据量。 有关详细信息,请参阅How to: Page Through Query Results

实体框架自动生成的任何命令都可能比数据库开发人员显式编写的类似命令更复杂。 如果您需要对针对数据源执行的命令进行显式控制,请考虑对表值函数或存储过程定义映射。

关系
 

若要获得最佳查询性能,必须将实体之间的关系同时定义为实体模型中的关联和数据源中的逻辑关系。

默认情况下,当您执行 ObjectQuery<T> 时,并不返回相关对象(但返回表示关系自身的对象)。 可以采用以下三种方法之一加载相关对象:

  1. 在执行 ObjectQuery<T> 前设置查询路径。

  2. 对于对象公开的导航属性调用 Load 方法。

  3. 将 ObjectContext 上的 LazyLoadingEnabled 选项设置为 true。 注意,在使用Entity Data Model Designer生成对象层代码时,将自动执行此操作。 有关详细信息,请参阅 Generated Code Overview

在考虑要使用哪个选项时,请注意在对数据库的请求数与单个查询中返回的数据量之间进行权衡。 有关详细信息,请参阅Loading Related Objects

查询路径定义查询返回的对象的图。 当定义查询路径时,仅需对数据库请求一次,即可返回该路径定义的所有对象。 如果使用查询路径,看似简单的对象查询也可能需要对数据源执行复杂的命令。 这是因为,在单个查询中返回相关对象需要一个或多个联接。 对复杂实体模型(如具有继承关系的实体或包含多对多关系的路径)进行的查询的复杂性将进一步加大。

System_CAPS_note说明

使用 ToTraceString 方法可以查看将由 ObjectQuery<T> 生成的命令。 有关详细信息,请参阅How to: View the Store Commands

如果查询路径包含过多相关对象,或对象包含过多行数据,数据源可能无法完成查询。 如果查询所需的中间临时存储区超过数据源的容量,则会出现这种情况。 出现这种情况时,通过显式加载相关对象可以降低数据源查询的复杂性。

通过对返回 EntityCollection<TEntity> 或 EntityReference<TEntity> 的导航属性调用 Load 方法,可以显式加载相关对象。 显式加载对象要求每次调用 Load 时都往返一次数据库。

System_CAPS_note说明

如果在循环访问所返回对象的集合时调用 Load,例如,当您使用 foreach 语句(在 Visual Basic 中为 For Each)时,数据源特定的提供程序必须在单个连接上支持多个活动的结果集。 对于 SQL Server 数据库,必须在提供程序连接字符串中指定 MultipleActiveResultSets = true 值。

当实体没有 EntityCollection<TEntity> 或 EntityReference<TEntity> 属性时,还可以使用 LoadProperty 方法。 这在使用 POCO 实体时非常有用。

尽管显式加载相关对象将减少联接数并减少冗余数据量,但 Load 要求与数据库之间进行重复的连接,这在显式加载大量对象时可能会带来很高的成本。

当您对 ObjectContext 调用 SaveChanges 方法时,将为上下文中每个添加、更新或删除的对象生成一个单独的创建、更新或删除命令。 这些命令在单个事务中针对数据源执行。 对于查询,创建、更新和删除操作的性能取决于概念模型中映射的复杂性。

在显式事务中执行的、需要由分布式事务处理协调器 (DTC) 管理的资源的操作与不需要 DTC 的相似操作相比,前者的成本要高得多。 在以下情况下,将需要提升到 DTC:

  • 具有对 SQL Server 2000 数据库执行的操作的显式事务,或始终将显式事务提升到 DTC 的其他数据源。

  • 当连接由Entity Framework管理时,具有对 SQL Server 2005 执行的操作的显式事务。 因为只要在单个事务中关闭并重新打开连接,SQL Server 2005 就会提升到 DTC(这是Entity Framework的默认行为),所以会发生上述情况。 使用 SQL Server 2008 时,不会发生这种 DTC 提升的现象。为了避免在使用 SQL Server 2005 时出现此提升,必须在事务中显式打开和关闭连接。 有关详细信息,请参阅Managing Connections and Transactions

当在 System.Transactions 事务内执行了一个或多个操作时,将使用显式事务。 有关详细信息,请参阅Managing Connections and Transactions

您可以通过以下策略改进实体框架中查询的总体性能:

 

当应用程序首次执行查询时,基于实体模型生成视图需要很高的成本。 使用 EdmGen.exe 实用工具可以将视图预生成为 Visual Basic 或 C# 代码文件,此文件可以在设计期间添加到项目中。 还可以使用文本模板转换工具包生成预编译的视图。 预生成的视图在运行时进行验证,以确保这些视图与指定实体模型的当前版本保持一致。 有关更多信息,请参见How to: Pre-Generate Views to Improve Query Performance在 Entity Framework 4 中使用预编译或预生成的视图隔离性能(可能为英文网页)。

在使用非常大的模型时,适用以下注意事项:

.NET 元数据格式将一个给定的二进制文件中的用户字符串字符数限定为 16,777,215 (0xFFFFFF)。 如果您正在为一个非常大的模型生成视图,并且视图文件达到此大小限制,您将得到编译错误“没有剩余的逻辑空间来创建更多用户字符串。” 此大小限制适用于所有托管二进制文件。 有关更多信息,请参见演示如何在使用大而复杂的模型时避免错误的博客(可能为英文网页)。

跟踪对象上下文中返回的对象会引发成本。 检测对象更改以及确保对于同一个逻辑实体的多个请求返回相同的对象实例均要求将对象附加到 ObjectContext 实例。 如果您不打算更新或删除对象并且不需要标识管理,请考虑在执行查询时使用 NoTracking 合并选项。

在某些方案下,使用 Include 方法指定查询路径要快得多,因为它要求与数据库之间的往返次数较少。 然而,在其他方案中,加载相关对象时增加与数据库之间的往返次数可能会更快,因为联接较少的较为简单的查询会使数据冗余程度下降。 因此,我们建议您测试用于检索相关对象的不同方法的性能。 有关详细信息,请参阅Loading Related Objects

为了避免在单个查询中返回过多的数据,请考虑将查询结果分页为多个可管理的组。 有关详细信息,请参阅How to: Page Through Query Results

在大多数情况下,应在 using 语句(在 Visual Basic 中为 Using…End Using)内创建一个 ObjectContext 实例。 这样,通过确保当代码退出语句块时自动释放与对象上下文关联的资源,可以提高性能。 但是,当控制权绑定到由对象上下文管理的对象时,只要需要绑定并手动释放它,就应维护 ObjectContext 实例。 有关详细信息,请参阅Managing Connections and Transactions

当应用程序执行一系列对象查询或频繁调用 SaveChanges 来持续对数据源执行创建、更新和删除操作时,Entity Framework必须不断地打开和关闭与数据源的连接。 在这类情况下,请考虑在开始这些操作时手动打开连接,并在操作完成后关闭或释放连接。 有关详细信息,请参阅Managing Connections and Transactions

实体框架的一些性能数据发布在 ADO.NET 团队博客(可能为英文网页)上的下列帖子中:

posted on 2017-04-26 10:23  xuelei被占用了  阅读(740)  评论(0编辑  收藏  举报