如何在 ASP.NET项目里面正确使用Linq to Sql（转）

原文地址：http://www.cnblogs.com/sumtec/archive/2009/05/31/1285331.html

老久不上来写技术类的东西了，偶尔回归一下吧。（其实，这篇文章8个月前写了个大半，后来一直没有时间去完善，再后来就因为各种原因给放下来了。）

非常抱歉，由于需要发表其他文章的缘故，我只能忍着不修正文中一小部分错误，以及增加一些有助免于误解的内容。这里特别说明一下，本文不是要讨论缓存机制的好坏，更不是要讨论如何缓存对象。而是说DAL/BLL上面对DataContext的处理。另外一个需要注意的地方，是修改了一个错误，原来大部分都写成IQueryable了，实际上应该是除了最后一个之外，都是IEnumerable。原因是什么需要大家想一下。此外，也需要大家注意的事，我所提出来的缓存，并不是直接利用Linq2Sql的代码来缓存，而是指是否便于缓存。这部分的内容，会在文章后面补充说明。

Linq to Sql 用的人也应该有些吧，我在cnblogs上面看老赵写的那几篇文章（请看08年9月左右的文章），感觉也很有深度，有不少启发。因此我也打算写一点我自己的实践经验，希望也能同样给大家一些有用的启发吧。

我首先想要问一下大家，Linq to Sql有哪些很特别的地方？这个问题的答案肯定五花八门，我说一下我看到的一些问题吧。

首先，Linq to Sql的基础之一是DataContext，而另外一个基础，则是通过映射产生的实体类，以及这些实体类的Table<>对象。这个不是废话嘛！我想很多人都应该知道这个最基本的知识，不过却不见得有多少人真正注意到，或者认真思考一下这里面的“机关”。不知道“机关”在哪里，那么就不可能写出合适的代码。比如说，在某个页面里面（N层结构没有给弄好的情况下），或者在某个业务逻辑里面（有N层结构），你的Linq to Sql的代码是否是长这样的？

Code (MyDataContext db = new MyDataContext)
{
  var q = from product in db.ProductInfos
          where product.Price > 100
          select product;
  DoSomethingWithProducts(q.ToList());
}

“对啊，就是长这样的，有什么问题吗？”当然有问题啦，否则我也不写这个随笔了。不知道大家有没有想过这么一个问题，什么叫做 Context？Context就是上下文，上下文的意思就是，依赖于这个上下文的对象，必须存活在这个上下文里面。脱离了这个上下文，那些对象就会出现错误。事实上也确实如此：在上面的例子里面，从ProductInfos中得到的q.ToList()，里面的每一个元素都依赖于 MyDataContext。换句话说MyDataContext如果被注销了，q.ToList()生成的对象也就会“部分功能失效”。

“失效就失效好了，反正该做的工作已经做完了，q.ToList()也已经利用完了。”不错，在上面的例子里面，不会发生什么错误。不过这么写的话，会比较难使用的。为什么这么说？我举一个具体的例子：这个网站需要用户登录，而所有的业务逻辑几乎都依赖于当前用户。如果说，我们使用上面的 using模式，那么我估计你的代码不外乎是如下两种情况：

1、每一次需要当前用户的地方，你都需要从数据库读取；或者

2、你把当前用户保存为全局变量了，但是你发现currentUser.CompanyInfo因为上下文已经抛弃了，因此是无法使用的，业务层不得不每一次都重新从数据库读取该用户所属公司的数据。

这两种形式如下所示：

Code 通过实体对象来存储
// 注意！这个函数是不在BLL层的，而是更上层的某些处理，为了演示起来简单，显得是BLL层的东西。
public double GetCurrentBalanceByObject()
{
   int userId;
   int.TryParse(HttpContext.Current.User.Identity, out userId);
   UserInfo user = GetUser(userId);
   CompanyInfo company = GetCompanyByUser(user);
   IEnumerable<TransactionInfo> transactions = GetTransactionsByCompany(company);
   return transactions.Sum(item => item.Amount);
}

// 后面这几个方法才是BLL层的东西，后面的例子也相同。
public UserInfo GetUser(int userId)
{
   using(MyDataContext context = new MyDataContext)
   {
      return context.UserInfos.Where(item => item.UserId == userId).FirstOrDefault();
   }
}

public CompanyInfo GetCompanyByUser(UserInfo user)
{
   using(MyDataContext context = new MyDataContext)
   {
      return context.CompanyInfos.Where(item => item.UserId == user.Id).FirstOrDefault();
   }
}

public IEnumerable<Transaction> GetTransactionsByCompany(CompanyInfo company)
{
   using(MyDataContext context = new MyDataContext)
   {
      return context.TransactionInfos.Where(item => item.CompnayId == company.Id).ToList;
   }
}

// 实际上很容易就退化为通过键值来存储，因为在这种设计方式下面，
// 实际上根本没有什么必要去传输整个对象。
// 我们可以想象，这个时候很多的操作其实是依赖UserId和CompanyId的，
// 而我见过的“有趣”设计，是在Page_Load事件中，不管是否需要用到，
// 都会将 HttpContext.Current.User.Identity以及
// GetCompanyByUserId(userId).CompanyId 保存为当前页面的全局变量。
// 其实这样是违背了Linq的设计初衷的。
// 当然，我不是说不缓存最经常用的东西，该缓存还是要缓存的，只是，
// 下面的设计只会把问题变复杂。因为这里只能缓存一个id值，内部还是要重复获取User或者 Company对象的。
// 下面就是一个只传Id的做法：
public double GetCurrentBalanceByObject()
{
   int userId;
   int.TryParse(HttpContext.Current.User.Identity, out userId);
   CompanyInfo company = GetCompanyByUserId(userId);
   IEnumerable<TransactionInfo> transactions = GetTransactionsByCompanyId(company.CompanyId);
   return transactions.Sum(item => item.Amount);
}

public CompanyInfo GetCompanyByUser(int userId)
{
   using(MyDataContext context = new MyDataContext)
   {
      return context.CompanyInfos.Where(item => item.UserId == userId).FirstOrDefault();
   }
}

public IEnumerable<Transaction> GetTransactionsByCompanyId(int companyId)
{
   using(MyDataContext context = new MyDataContext)
   {
      return context.TransactionInfos.Where(item => item.CompnayId == companyId).ToList();
   }
}

如果你是第一种情况，那么很明显，你会有大量重复的SQL调用。

如果是第二种情况，其实也不见得好到哪里去。因为：

1、currentUser可能不需要经常取，但相关的其它内容，由于上下文各自独立，你还是经常在重复的获取的；

2、有一个地方你无法绕过去——如果你要修改当前用户的属性，而这个全局的当前用户不是当前Context产生的，你还非得从当前Context取出来，然后再修改；或者如果你企图通过currentUser.CompanyInfo来访问的话，也会报错。

3、因为currentUser的上下文已经被抛弃了，因此程序会很容易设计成传入的不是一个UserInfo，而是一个int类型的Id值，否则底层很容易一不小心就用到这个实际上功能不全的对象，然后就抛出异常了。但这样做的后果是，获取同一个类型的实体对象，可能会有各种不同的重载形式，例如：

IEnumerable<TransactionInfo> GetTransactionsByUserId(int userId);
IEnumerable<TransactionInfo> GetTransactionsByCompanyId(int companyId);
IEnumerable<TransactionInfo> GetTransactionsByCompanyId(int companyId, EAccountName account);
IEnumerable<TransactionInfo> GetTransactionsByCompanyId(int companyId, EAccountName account, ETransactionType transactionType);

因为这种设计实施之后，有时很可能就会出现只有userId的情况，那么这个时候即使UserInfo对象中其实也存在CompanyId的值，也还是要重新获取一遍UserInfo对象。（注意，后面提到的方案，并非不需要缓存了，而是因为在同一个Context下，可以有效地利用实体对象，因此你可以将BLL层设计依赖实体对象，而不是id值，因此缓存整个实体对象会更加容易。）为了简化这一过程，就可能会产生不同的获取形式。

这样设计完整个系统之后一跑，看着好像没什么，但真正上线却发现有点慢。当我们打开Sql server的Profiler一看，会发现很简单的一个页面的访问，其数据库访问会搞到几十次甚至上百次，其中有很多Sql语句是完全重复的。

这个问题怎么解决呢？有人会说，加个缓存机制吧。也许吧，但这种增加复杂度的设计，我觉得还是不得已而为之的一种做法。（或者说，缓存很好，那是另外一种解决方案，但不解决这个问题。）我认为更好的解决办法是，将上下文在当前页面中缓存起来。所谓的上下文，就是一种运行环境，而一次页面访问，其环境应该是相同的。首先，我们对MyDataContext做一个扩展：

Codepartial class MyDataContext
    {
        private const string c_KeyCurrentHttpContext = "chctx";

        static public MyDataContext CurrentHttpContext
        {
            get
            {
                MyDataContext context = CurrentHttpContextWeak;
                if (context == null)
                {
                    context = new MyDataContext();
                    CurrentHttpContextWeak = context;
                }
                return context;
            }
        }

        static private MyDataContext CurrentHttpContextWeak
        {
            get
            {
                return HttpContext.Current.Items[c_KeyCurrentHttpContext] as MyDataContext;
            }
            set
            {
                HttpContext.Current.Items[c_KeyCurrentHttpContext] = value;
            }
        }

        static internal void TryDisposeCurrentHttpContext()
        {
            MyDataContext context = CurrentHttpContextWeak;
            if (context != null)
            {
                context.Dispose();
                CurrentHttpContextWeak = null;
            }
        }
    }

然后我们再制作一个HttpModule（并且在web.config里面配置好）：

Code/// <summary>
    /// 实现自动抛弃当前数据库上下文的模块
    /// </summary>
    public class MyDataContextAutoDisposeModule : IHttpModule
    {
        #region IHttpModule Members

        private HttpApplication _context;
        public void Init(HttpApplication context)
        {
            _context = context;
            context.PostRequestHandlerExecute += new EventHandler(context_PostRequestHandlerExecute);
        }

        void context_PostRequestHandlerExecute(object sender, EventArgs e)
        {
            MyDataContext.TryDisposeCurrentHttpContext();
        }

        #endregion
    }

接下来，我们只要在逻辑层这么直接写即可：

Codepublic static IQueryable<TransactionInfo> GetCompanyAccountDetails(UserInfo operatorUser, EAccountName account)
        {
            // 权限验证
            if (!operatorUser.Permissions.Contains(EUserPermissions.ViewAccountDetails))
                CLog.CurrentHttpContext.ThrowFailedException(new CPermissionException(EUserPermissions.ViewAccountDetails));

            var q = MyDataContext.CurrentHttpContext.TransactionInfos.Where(t => t.CompanyId == operatorUser.CompanyId && t.AccountName == account);
            return q;
        }

这么改造完之后，你会发现几乎可以在所有地方直接返回IEnumerable（除了有的时候Linq to Sql本身有Bug），整个逻辑层内的设计变得简单化：一开始检查各种参数（是否具备完整或者部分权限），然后根据检查结果做完全信赖的操作。由于返回的是实体对象，或者IEnumerable，几乎所有重复性的Sql调用也随之自然消失了。如果有所怀疑的话，您可以用Sql Profiler自行做修改前后的对比，看看效果是否“惊人”？

也许有人会质疑，这样好吗？岂不是通过user.Company.Transactions就可以得到所有的Transaction了？没错，如果所有东西都是公开的话，就会有这个问题。如果要彻底解决这样的问题，需要将这些部分变成对逻辑层可见，而对其它层不可见的修饰方式——比如两层在一个 dll里面，这些属性是internal的，或者放在两个dll里面并且打上InternalsVisibleTo标记。通过这种方式，就可以避免上层直接查找DAL中一些在BLL中需要经过权限检查才可以得到的内容。当然，如果项目比较小的情况下，你也可以选择不要这么麻烦，直接控制代码质量即可（要求有些东西必须通过BLL来获得）。

_________________________________________

后记：

因为中间跳过了一些产生问题的步骤，引起了不少的误解，这里特别解释清楚：

1、原方案因为不在同一个Context之下，所以返回的实体对象是不分功能失效的。考虑：

_user = BLL.GetUser(HttpContext.Current.User.Identity);

这样的缓存，由于DataContext在GetUser中已经抛弃了，因此，_user.Company这样的访问就会报错。最终你更可能选择，要么全面放弃实体对象之间的关联属性，要么就只是缓存userId。无论哪一种方案，都意味着，当你缓存userId的时候，是不会自动缓存对应的 CompanyInfo的。（这么说明报了吧？这才是我说的，可以自动缓存的意思。）

关于这一部分的误解，回复中有一个例子：

public static T_User TestMethod2()
{
return dbUserDataContext.CurrentHttpContext.T_User.FirstOrDefault();
}

// 调用代码
for (int i = 0; i < 5; i++)
{
BLL.dbUser.TestMethod2();
}

这样显然是会重复发出Sql调用的，这不是我说的场景，我说的是：

public static T_User TestMethod2()
{
return dbUserDataContext.CurrentHttpContext.T_User.FirstOrDefault();
}

// 调用代码

_user = BLL.dbUser.TestMethod2(); // 缓存
for (int i = 0; i < 5; i++)
{

Debug.Writeline(_user.Company.CompanyName); // 这个时候Company就不会不停的调数据库
}

从这个角度来讲，我并没有讨论如何缓存，而是讨论的如何便于缓存，如果在不需要过高性能要求的情况下，不动用完整的、同时也很复杂的缓存机制。

2、我们再看另外一个例子：

http://www.cnblogs.com/JeffreyZhao/archive/2008/02/19/using-translate-method-and-modify-command-text-before-query-in-linq-to-sql.html

public List<Item> GetItemsForListing(int ownerId)
{
    ItemDataContext dataContext = new ItemDataContext();
    var query = from item in dataContext.Items
                where item.UserID == ownerId
                orderby item.CreateTime descending
                select item;

    return query.ToList();
}

大家可以看到，这个设计里面，返回至十一个ToList()，也就意味着已经从数据库中取出所有对象了。但是有的时候，我们实际上希望在这个基础上再进一步收缩。在这种情况下，我们就不能很好的重用原来的代码了，因为这个函数返回的是一个组内存对象，而不是一个IQueryable的表达式。那么我们要么在这个List<Item>结合中在内存中进行过滤，要么重新写一个方法来处理。无论如何，这都导致了BLL层的臃肿。如果是如下的写法呢：

public IQueryable<Item> GetItemsForListing(User owner)
{
    ItemDataContext dataContext = new ItemDataContext();
    var query = from item in dataContext.Items
                where item.UserID == owner.Id
                select item;
    return query;
}

注意，我连order by 也去掉了，因为这完全可以在更上一层再决定如何处理。同样的，我也可以在这个返回值得基础上继续做进一步的筛选。而这种筛选无论在BLL还是更高层次来做，都会有着更高的效率。（说到这里，我也不得不担心，有人会说，这种筛选应该被封闭起来。这部分是另外一种讨论了：BLL到底应该封装到什么程度。这里不作过多的争论了，我们假定轻量级的BLL更有灵活性。不过如果非要争论，我会说：首先，原来的设计，你也无法避免UI层用这个函数的返回值来做自己的筛选和处理；其次，我的设计，也完全可以在BLL提供进一步的标准筛选函数。因此这也并非我要讨论的内容。）

那么，这么做有什么好处呢？最大的好处是，提供同样级别功能的BLL情况下，我的设计更可能只去所需要的数据——严格的说应该限定为，在只访问一次数据库的情况下。其他情况下也有可能和原来设计一样，需要依赖缓存来提高性能。不过实战情况下，可以发现这么做之后一般都是获取更少的数据。

无论如何，减少从数据库取出的不必要数据，肯定是一件好事。如果加上缓存机制的话，更少需要缓存的数据，也可能提供更高的效率。

3、有一点不需要多说了，就是如果要加入缓存机制的话，在同一个Context下面肯定比在不同Context下面好处理得多，最简单的一个原因，就是不需要考虑Detach和Attach的问题（偏偏Linq2Sql不存在Detach的方法，除非你自己做每一个对象的深拷贝工作，这拜 Linq2Sql的Tracker所赐，具体这也不讨论了）。

回复中还有一种说法，认为可以尽量将操作都封装到BLL层，例如：

using (new context)
{
receiveRelatedData()
using (new tansation)
{
action1 (context);
action2 (context);
action3 (context);
}
}

例子中，并没有很清晰的指出，是整个代码在BLL中呢，还是只有receiveRelatedData和actions是BLL。无论如何，我想这是另一个问题了，就是BLL应该复杂到什么程度。我个人的理念是：在保证逻辑完整的情况下，尽量提供最小的原子操作，让上层自由互相组合。这样可以避免 BLL越来越臃肿，甚至有一些功能会逐渐被抛弃，进而被遗忘的问题。例如，我会提供获取当前用户、某用户购买一个产品，这样两个原子操作，来达到当前用户购买产品的目的。否则，可以想象，让如果要让管理员强制另一个用户购买一个产品，将会需要另一整套的逻辑。而按照我的思路，只要设计一个管理员获取另一个管理员，以及代理权限系统即可，而不需要连后面的购买过程也封装起来。或者说，前一种思路容易导致BLL函数数量呈N*M的方式增长，而我的思路则是尽可能让BLL按照N+M的方式增长。（这个如果要讨论的话，还是另外开篇把，这里可能说不完。）

不过即使是这样，我也没有看出为何不可直接将Context缓存起来？比如：

receiveRelatedData(CurrentContext)
using (new tansationScope())
{
action1 (CurrentContext);
action2 (CurrentContext);
action3 (CurrentContext);
}

还是一样可以跑得通吧？

简而言之，本文并非否认缓存机制的作用，更不是要替代缓存机制。与之正好相反，这里面是要让缓存变得更容易一些，同时在一定范围内，提高不使用复杂缓存机制时的效能，推迟系统变得更复杂的时间。

posted @ 2010-04-12 16:47 today4king 阅读(691) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源！
· 周边上新：园子的第一款马克杯温暖上架

公告

昵称： today4king
园龄： 17年10个月
粉丝： 178
关注： 106

+加关注

2010年4月

日

一

二

三

四

五

六

Loading

TODAY ^_^

如何在 ASP.NET项目里面正确使用Linq to Sql（转）

公告

搜索

常用链接

积分与排名

随笔分类

随笔档案

相册

Friends

QMX Team

推荐排行榜

最新评论