Mego(02) - NET主流ORM框架分析
接上文我们测试了各个ORM框架的性能,大家可以很直观的看到各个ORM框架与原生的ADO.NET在境删改查的性能差异。这里和大家分享下我对ORM框架的理解及一些使用经验。
ORM框架工作原理
所有的ORM框架的工作原理都离不开下面这张图,只是每个框架的实现程度不同但是最终的目的是相同的。
如果是一个ORM框架那么一定会有上图中蓝色部分的这几个元素,无论是增删改查对于ORM一定是以对象为起点,使用对象构造出LINQ表达式,这样我们在对象的世界中可以描述我们希望对数据库所进行的操作,LINQ的最终实现其实也是Lambda表达式(必尽LINQ在代码上会直观很多),功能较强的ORM中都会记录有对象类型到数据库对象的元数据,使用这些元数据可以将复杂的Lambda表达式翻译成一个通用的中间表达式,这个表达式其实是抽象于各个不同数据库的具体实现,最后中间表达式再按指定数据库的具体实现生成最终的SQL语句,交由ADO.NET对象执行到数据库,如果数据存在返回则会回写到CLR对象中。
以上概括了所有ORM的实现过程,这里比较典型的是Dapper,它之所以小巧而高性能的原因正是因为该框架中没有绿色的部分,可以说是所有ORM框架中最为精简的(可能还会存在其他类似的框架,这里仅用Dapper作为典型案例说明),因此没有多余的部分自然小而快。然而绿色部分的存在就决定了该ORM框架的功能到底有多强,刚好目前世面上的ORM框架中只有EF是完全实现了绿色框中的各个元素,并且支持最为全面,所以EF必然重而慢(至少EF6相对其他框架是比较差的)。
典型ORM框架实现
- Dapper:需要自己手写SQL语句完成操作,比较简单直接不过还有DapperExtensions的帮助,可以在插入、修改及删除时不用写SQL语句全对象操作,这里需要指出的是它应该不能算是一个完全的ORM框架,因为日常开发占比多的查询还是需要手写SQL,无法对象类型化。
- Nhibernate:这是个比较久远的框架,该框架需要自己配置元数据功能上会比DapperExtensions强一点,不过对于查询表达式没有太好的支持。
- SqlSugar,Chloe.ORM:此类框架虽然不能支持LINQ但是可以实现自己一套Lambda表达式用于生成SQL语句,总之其总体思想就是把SQL语法转换成表达式语法,比较典型的是会用表达式中的变量名用作生成SQL语句中的别名,而且附加功能会比较多,总之比较灵活实用。
- Linq2db:此类ORM算是实现的比较完整的ORM流程(见上图),而且支持众多的数据库,总之功能算是比较强大了。
EF功能最强的ORM
EF是目前为止功能最强的ORM,这个相信大家没有什么争议,大家可以参考一下这份文档 (EF Core and EF6 Feature by Feature Comparison),其中列出了EF6与EFCore的功能特性,相信没有哪个ORM框架实现了其中大部分的特性,下面随便列举几个特性:
- 全面支持LINQ查询,有不少框架也会支持LINQ可是使用时会发现有些写法是不支持的,但是EF是目前支持最全的,在截止到目前为止EFCore的正式版本中也没有完全实现EF6对LINQ的支持。
- EFCore性能提升:从上一遍博客(Mego(1))中可以看出对于个功能强大的ORM框架而言EFCore已提升相当多了总之已非常接近原生的ADO.NET框架了。
- 对象继承:这是个很好的设计,它可以让你将关系数据库实现对象继承化,在数据表中也会存在等价父子表。
- 数据库迁移功能,无论你怎么看待这个功能,但是对于开发而言这个功能太实用了,相信大家在很多DEMO中可以见到使用EF生成数据库。
- 对象的集合属性展开,通常我们在取订单时也希望一起把明细也取出来,更多的情况是还可以把订单数据分页,这个功能在大部ORM都是没有的需要自己处理,然后在EF中只需要写一行代码就能搞定。
- 多对多关系:这个也是个比较常用但是也在其他ORM比较少见的功能,EF也是目前支持最好的。
- EF框架对接了微软的众多其他需要数据访问的框架,例如ASP.NET Identity,ASP.NET WebApi ODATA。
EF与EFCore缺陷
虽然EF或EFCore功能已经很强大了,不过在开发过程中还有很多不足的地方,也有很多缺陷这也是导致有很多人使用之后而放弃的原因之一(当然还有EF6的性能问题)。下面将列一下EF6的不足给大家参考。
数据更新功能不足
在EF中数据提交的功能一直不行,在EF6中所有的数据操作都是单个对象分别提交了,这也就表示在大量数据提交过程中每个对象都要发送一次数据库,这也是导致为什么性能底下了,而且更新及删除数据一定要从数据库取回对象或附加对象才能操作。这个问题在EFCore中都得到解决而且性能比较好如前文的测试可见。但是EF到目前都不能支持条件更新、条件删除。不过这个问题可以使用这个框架(Entity Framework Plus)解决,不过这个框架是收费的。
创建时间修改时间问题
我们在业务系统开发时常会遇到创建和更新数据时需要记录创建时间或修改时间的情况,不过目前无论是EF或EFCore中都只能用触发器来解决,不过当数据表变多时维护这些触发器也是个比较麻烦的事情。有人会想到用默认值,这个EF中是支持的,但是EF不能选择性的插入或更新指定的字段,这是个两难的情况。
创建及修改时间只是这类问题的一个例子,这类问题可以概括为我们在插入或更新数据时希望指定字段是调用相应的数据表达式生成的,而不是应用程序的值,这里可以举个实例给大家看,在一个负载均衡的架构中我们需要在创建订单时生成订单流水号,这个流水号一定要唯一且连续,在这种多服务器并发的情况下只有在数据库生成这个流水号才是比较好的选择,这样可以充分保证当提交失败时新分的流水号可以归还,同时也保证大家依次生成不会重复且连续,这个时候就很需要ORM可以自动使用单号生成函数来生成值。
EF中的曲线解决,在EF6中插入、更改或删除操作是支持存储过程映射的,大家可以参考这个文章(Entity Framework Code First Insert, Update, and Delete Stored Procedures (EF6 onwards))里面有详细的说明,这里我们可以做文章,我们修改存储过程改为调用我们指定的表达式即可,这样可以不用触发器,也能达到目的。这里有人会问维护存储也需要比较大代价,这里我们可以重写EF的数据库迁移生成存储过程的代码来统一处理。
实体集合属性多层展开
无论是EF或EFCore中有一个Include函数,用来在返回实体对象时显示包含它的集合或对象属性,这个操作被称为属性展开,这里先这么称呼。不过可以展开对象属性(例如订单 -> 客户 -> 负责人 -> 公司),也可以展开集合属性(例如 订单 -> 明细集合),这时集合下面的属性就不能展开了例如我希望得到(例如 订单 -> 明细集合 -> 产品)这是不支持的。
补充EF实际内部代码是可以支持这种操作但是没公开,如果有对ASP.NET WebApi OData有所了解的朋友可以知道,如果你的OData服务是建立在EF基础之上的,在ODATA语法中可以支持多级数据展开的,并且在EF6中得到很好的实现,不过这些的前提是你的数据库是SQL Server。
对象关系限制
例如一个订单会有多个明细,每个明细都会对应一个产品,从逻辑上我们就可以认为订单和产品是多对多关系了,但是在EF中就没有这么自由的可以操作了。
在EF中关系的操作有很多限制,这个特别在多对多关系中很严重,EF6中会生成一个隐藏的关系实体用来建立关联,这些都是你不能控制的,而且在关系链接中要求主表一定要是主键,不过在EFCore中这些问题得到一些解决,不过EFCore目前不能支持多对多关系,至少目前的Flush API中还没有看到。
时间戳
感觉EF中不少特性都是为SQL Server设计的,EF中强制时间戳必须CLR属性是字节数组,不过在MySQL中的时间戳其实就是日期时间。
多数据库实现差异
EF和EFCore是支持多个数据库,其原理是EF定义的前文所说的中间表达式,然后再交给各方自行实现后续的操作。这种设计有如下缺点:
- 数据库支持绑定了数据访问组件,例如MySQL.Data.Entity这个组件必须需要在MySQL.Data组件下工作,这时如果你想换个访问MySQL的组件是不可以的。
- 数据库提供程序实现代价太大,如果大家有时间可以去看下EntityFramework.SqlServer或MySQL.Data.Entity里的实现代码,这些都是著名公司微软和Oracle维护的代码,其中的实现代码非常复杂,对于一般的团队而言可以算是一个非常大的项目。
- 数据库提供程序实现质量,还是以MySQL.Data.Entity为例子,每个提供程序并不像微软那样完全实现EF在SQL Server中的各个功能,而且代码非常复杂问题会很多,即使是Oracle所维护的代码也是同样糟糕,下面分享MySQL.Data.Entity的两个例子。
MySQL.Data.Entity问题一:这个组件在MySQL5.6由于数据库的主键限制在700多个字节,因此它在自动迁移数据库操作时会报错主键过长错误,等于这个是完全不能用的。
MySQL.Data.Entity问题二:这个组件在MySQL5.7中,由于数据库的BUG(虚拟列如"SELECT 1"的IS NULL判断错误问题)会导致特定的LINQ表达式生成的SQL脚本是不能得到正确结果的。
MySQL.Data.Entity问题三:对于继承的SQL生成这一部分是完全没有实现的,你会发现所生成的脚本都是错的。
MySQL.Data.Entity问题四:EF的Include操作的具体实现是依赖于CROSS APPLY(SQL Server)语法的,不过MySQL中完全没有,也很写出替代语句,因此这个功能在MySQL下等于是不存在的。
以上是因为我参加了EF对接MySQL的改造项目,这是我和我的团队折腾了几个月才得出的一些总结,不过好在我们最后通过修改MySQL.Data.Entity源码解决了这些问题。
总之其他框架不能确定,但是在EF中各个数据库的支持程度是很不对称的。
总结
在EntityFramework长达10年的发展历程中,开始发展很快,但是后面到EntityFramework6.1.3(2015年3月)这个版本时就好像是EntityFramework的结束,之后EntityFramework6就再没有此实制上的更新了直到今天,应该是微软已经放弃它转向EntityFrameworkCore上,不过EntityFrameworkCore的发展也没有这么快,至今还没有超过EntityFramework6,所以直到今天微软都不敢对外宣布放弃EntityFramework6。
以上是我的个人见解,仅供参考。