Fork me on GitHub

Repository 返回 IQueryable?还是 IEnumerable?

这是一个很有意思的问题,我们一步一步来探讨,首先需要明确两个概念(来自 MSDN):

  • IQueryable:提供对未指定数据类型的特定数据源的查询进行计算的功能。
  • IEnumerable:公开枚举数,该枚举数支持在非泛型集合上进行简单迭代。

IQueryable 继承自 IEnumerable,它们俩最大的区别是,IQueryable 是表达式树处理,可以延迟查询,而 IEnumerable 只能查询在本地内存中,Repository 的概念就不多说了,在“伪 DDD”设计中,你可以把它看作是数据访问层。

下面我们先实现 Repository 返回 IEnumerable:

public interface IBookRepository  
{
    Book GetById();
    IEnumerable<Book> GetAllBooks();
    IEnumerable<Book> GetBy....();
    void Add(Book book);
    void Delete(Book book);
    void SaveChanges();
}

上面是我们的一般接口设计,包含查询、增加、删除操作,你发现并没有修改,其实我们可以先通过 GetById 操作,然后取得 Book 对象,进行修改,最后执行 SaveChanges 就可以了,在持久化数据库的时候,会判断实体状态值的概念,最后进行应用改变。

GetBy....() 代表了一类查询方法,因为我们的业务比较复杂,对 Book 的查询会千奇百怪,所以,没有办法,我们只能增加各类查询方法来满足需求,最后可能导致的结果是,一个 Where 对应一个查询方法,IBookRepository 会充斥着各类查询方法,并且这些查询方法一般只会被一个 Application 方法调用,如果你查看下 GetBy....() 方法实现,会发现其实都大同小异,不同的只是 Where 条件,这样的结果就会导致代码变得非常的臃肿。

针对上面的问题,怎么办呢?因为 IEnumerable 是查询在本地内存中,所以没有办法,我们只能这样处理,那如何使用 IQueryable 会是怎样的呢?我们看下代码:

public interface IBookRepository  
{
    IQueryable<Book> GetBooks();
    void Add(Book book);
    void Delete(Book book);
    void SaveChanges();
}

只有一个 GetBooks 查询,那它能满足各类查询需求吗?我们看下 Application 中调用的代码:

public class BookApplication : IBookApplication  
{
    private IBookRepository _bookRepository;

    public BookApplication(IBookRepository bookRepository)
    {
        _bookRepository = bookRepository;
    }

    public IEnumerable<Book> GetAllBooks()
    {
        return _bookRepository.GetBooks().AsEnumerable();
    }

    public IEnumerable<Book> GetBooksByUser(int userId)
    {
        return _bookRepository.GetBooks().Where(b => b.UserId == userId).AsEnumerable();
    }

    //....
}

因为 IQueryable 是延迟查询,只有在执行 AsEnumerable 的时候,才会真正去查询,也可以这么说,BookApplication 可以根据需求任意构建查询表达式树,就像我们在 SQL Server 中写查询 SQL,SELECT * FORM Books 在 BookRepository 中进行构建,WHERE ... 操作在 BookApplication 中进行构建,最后的 F5 执行也在 BookApplication 中。

从上面的代码中,我们可以看到,IQueryable 很好的解决了使用 IEnumerable 所出现的问题,一个查询可以应对千变万化的应用查询,IQueryable 看起来好像是那么的强大,其实 IQueryable 的强大并不限于此,上面说的是查询表达式,那添加、修改和删除操作,可以使用它进行完成吗?修改和删除是可以的,添加并不能,具体可以参考 dudu 的这篇博文:开发笔记:基于EntityFramework.Extended用EF实现指定字段的更新

关于 EntityFramework.Extended 的扩展,需要记录下,因为这个东西确实非常好,改变了我们之前的很多写法和问题,比如,在之前使用 EF 进行修改和删除实体,我们一般会这些写:

public class BookApplication : IBookApplication  
{
    private IBookRepository _bookRepository;

    public BookApplication(IBookRepository bookRepository)
    {
        _bookRepository = bookRepository;
    }

    public void UpdateNameById(int bookId, string bookName)
    {
        var book = _bookRepository.GetById(bookId);
        book.BookName = bookName;
        _bookRepository.SaveChanges();
    }

    public void UpdateNameByIds(int[] bookIds, string bookName)
    {
        var books = _bookRepository.GetBooksByIds(bookIds);
        foreach (var book in books)
        {
            book.BookName = bookName;
        }
        _bookRepository.SaveChanges();
    }

    public void Delete(int id)
    {
        var book = _bookRepository.GetById(id);
        _bookRepository.Delete(book);//context.Books.Remove(book);
        _bookRepository.SaveChanges();
    }
}

上面的写法有什么问题呢?其实最大的问题就是,我们要进行修改和删除,必须先获取这个实体,也就是先查询再进行修改和删除,这个就有点多余了,尤其是 UpdateNameByIds 中的批量修改,先获取 Book 对象列表,然后再遍历修改,最后保存,是不是有点 XXX 的感觉呢,仔细想想,还不如不用 EF 来的简单,因为一个 Update SQL 就可以搞定,简单并且性能又高,为什么还要使用 EF 呢?这是一个坑?其实使用 EF 也可以执行 SQL,但这就像换了个马甲,没有什么卵用。

针对上面的问题,该如何解决呢?很简单,使用 EntityFramework.Extended 和 IQueryable 就可以,我们改造下上面的代码:

using EntityFramework.Extensions;

public class BookApplication : IBookApplication  
{
    private IBookRepository _bookRepository;

    public BookApplication(IBookRepository bookRepository)
    {
        _bookRepository = bookRepository;
    }

    public void UpdateNameById(int bookId, string bookName)
    {
        IQueryable<Book> books = _bookRepository.GetBooks();
        books = books.Where(b => b.bookId == bookId);
        books.Update<Book>(b => new Book { BookName = bookName });
    }

    public void UpdateNameByIds(int[] bookIds, string bookName)
    {
        IQueryable<Book> books = _bookRepository.GetBooks();
        books = books.Where(b => bookIds.Contains(bookIds));
        books.Update<Book>(b => new Book { BookName = bookName });
    }

    public void Delete(int id)
    {
        IQueryable<Book> books = _bookRepository.GetBooks();
        books = books.Where(b => b.bookId == id);
        books.Delete<Book>();
    }
}

有没有发现什么不同呢?原来 IQueryable 还可以这样写?这货居然不只是用于查询,也可以用于删除和修改,另外,通过追踪生成的 SQL 代码,你会发现,没有了 SELECT,和我们直接写 SQL 是一样的效果,在执行修改和删除之前,我们需要对查询表达树进行过滤,也就是说的,当我们最后应用修改的时候,会是在这个过滤的查询表达树基础上的,比如上面的 Delete 操作,我们先通过 bookId 进行过滤,然后直接进行 Delete 就可以了,哇塞,原来是这样的简单。

当 BookApplication 操作变的简单的时候,BookRepository 也会相应变的简单:

public interface IBookRepository  
{
    IQueryable<Book> GetBooks();
    void SaveChanges();//只用于Books.Add(book);
}

一个 IQueryable 表达树,一个 SaveChanges 操作,就可以满足 BookApplication 中的所有操作。


既然 IQueryable 是这么的强大,那用它就好了,为什么还要讨论呢?如果你 Google 搜索“Repository IQueryable”关键词,会发现大量的相关文章,我先贴出几个非常赞的讨论:

上面只是部分,关于这类的文章,老外写的非常多,而且评论中的讨论也非常激烈,因为英语实在差,我大概看了一些,出乎我意料之外的是,很多人都不赞成 Repository 返回 IQueryable,但讨论的却非常有意思,比如有个老外这样感叹:I'm still not convinced that returning IQueryable is a bad idea, but at least I'm far more aware of the arguments against it. 大致意思是:我仍然不相信返回 IQueryable 是一个坏主意,但至少我更了解他们的反对理由,是不是很有意思呢?

关于 Repository 返回 IQueryable 的讨论,我大致总结下:

好处:

  1. 延迟执行。
  2. 减少 Repository 重复代码(GetBy...)。
  3. IQueryable 提供更好的灵活性。
  4. ...

坏处:

  1. 隔离单元测试。
  2. 数据访问在 Repository 之外完成。
  3. 数据访问异常在 Repository 之外抛出。
  4. 该领域层将充斥着这些相当详细查询。
  5. ...

好处就不多说了,因为我们上面已经实践过了,关于坏处,“隔离单元测试”是什么意思呢?也就是说我们不能很好的对 Repository 进行单元测试,一方面是因为 IRepository 是那么的简单(就两个方法),另一方面 IQueryable 是查询表达树,它并不是完成时,只有在具体调用的时候才会查询完成,所以,对于 Repository 的单元测试,显然是没有任何意义的。

关于 Repository Pattern and IQueryable 这篇博文,我想再说一下,因为这个老外的观点非常赞,首先,它是基于 Repository 模式概念基础上说的,所以,我们一开始说:在“伪 DDD”设计中,你可以把 Repository 看作是数据访问层。这是两个不同的前提,我再大致总结下这个老外的观点:

  • However the mistake is not the IQueryable itself, but its purpose.(不是 IQueryable 本身的错误,而是它的目的。)
  • The point is that using IQueryable, you're asking for a query builder and not for a model.(问题的关键是,使用 IQueryable 是一个查询生成器,而不是一个模型。)
  • we want to specify what to get, not how to get it.(我们想通过规约得到它,而不是怎样去得到。)
  • tell it the what, not the how.

看了上面,是不是有点豁然开朗的感觉呢,其实从 Repository 的模式概念方面考虑,使用 IQueryable 确实不是很恰当,但不可否认的是,IQueryable 又这么强大和便利,怎么办呢?就像博文一开始强调的那样:Repository 的概念就不多说了,在“伪 DDD”设计中,你可以把它看作是数据访问层。

所以呢,如果你的项目是“伪 DDD”,并且 Repository 是被你看作“数据访问层”,那么使用 IQueryable 就没啥问题了。

posted @ 2015-08-25 15:45  田园里的蟋蟀  阅读(10966)  评论(124编辑  收藏  举报