为什么说 LINQ 要胜过 SQL

如果你还没有沉溺于 LINQ，就会想这有啥大惊小怪的。SQL 并没有坏掉，为什么还要对它进行修补呢? 为什么我们还需要另外一种查询语言呢?

流行的说法是 LINQ 同 C#（或者 VB）集成在了一起，故而消除了编程语言和数据库之间配合上的鸿沟，同时为多个数据源的组合提供了单一的查询接口。虽然这些都是事实，但仅是故事的一部分。更重要的是：当要对数据库进行查询的时候，LINQ 在大多数情况下都比 SQL 更加有效。

同 SQL 相比， LINQ 更简单、整洁而且高级。这样子更像是拿 C# 同 C++ 做比较。真的，尽管有时候使用 C++ 仍然是最好的选择（比如使用 SQL 的场景），但在大多数场景中，使用现代整洁的语言而不必为底层细节操作就是一项大胜利。

SQL 是一门非常古老的语言—发明于 1974 年。虽然经历过了无数此扩展，但从来没有被重新设计过。这就使得它有点混乱了—不像是 VB6 或者 Visual FoxPro。你也许已经慢慢变得习惯于此因而看不到任何错漏的地方!

让我们来看一个例子。你想要编写一个简单的查询来获取客户数据，如下：

1 SELECT UPPER(Name)
2 FROM Customer
3 WHERE Name LIKE 'A%'
4 ORDER BY Name

现在假设要将结果集里的这些数据提供给一个网页，并且我们想获取第 21 到 30 行数据。所以我们需要一个子查询：

1 SELECT UPPER(Name) FROM
2 (
3    SELECT *, RN = row_number()
4    OVER (ORDER BY Name)
5    FROM Customer
6    WHERE Name LIKE 'A%'
7 ) A
8 WHERE RN BETWEEN 21 AND 30
9 ORDER BY Name

而如果你需要支持版本（在 SQL Server 2005 之前的）更老的数据库，情况会更糟糕：

 1 SELECT TOP 10 UPPER (c1.Name)
 2 FROM Customer c1
 3 WHERE
 4    c1.Name LIKE 'A%'
 5    AND c1.ID NOT IN
 6    (
 7       SELECT TOP 20 c2.ID
 8       FROM Customer c2
 9       WHERE c2.Name LIKE 'A%'
10       ORDER BY c2.Name
11    ) 
12 ORDER BY c1.Name

这样做不仅复杂而混乱，而且也违背了 DRY 原则。如下是使用 LINQ 实现相同的查询功能。显然在简单性上更胜一筹：

1 var query =
2    from c in db.Customers
3    where c.Name.StartsWith ("A")
4    orderby c.Name
5    select c.Name.ToUpper();
6 
7 var thirdPage = query.Skip(20).Take(10);

只有当我们枚举到 thirdPage 时，查询才会实际执行。在从 LINQ 到 SQL 或者 Entity Framework 的场景中，翻译引擎会将（我们用两个步骤组合而成的）查询转换成一个 SQL 语句，这个语句是针对其所连接的数据库服务器进行了优化的。

可组合性

您可能已经注意到 LINQ 的另一个更微妙（微妙但意义重大）的好处。我们选择了组合中的两个查询步骤：

1 IQueryable<T> Paginate<T> (this IQueryable<T> query, int skip, int take)
2 {
3    return query.Skip(skip).Take(take);
4 }

我们可以这样做：

1 var query = ...
2 var thirdPage = query.Paginate (20, 10);

更重要的是，在这里我们可以进行任意的分页查询。换言之就是通过 LINQ 你可以把查询分解成一部分，然后在你的应用程序中重用。

联合

LINQ 另一好处就是你可以不用 JOIN 就能进行关系间查询。例如，我们想要列出所有购物在 $1000 或者以上，并且居住在华盛顿的顾客。我们会假定让购买项目化（也就是经典的采购/项目采购场景）并且把（没有顾客记录的）现金销售也囊括进来。这就需要在四个表（Purchase, Customer, Address 以及 PurchaseItem）之间进行查询。使用 LINQ，这样的查询不费吹灰之力：

1 from p in db.Purchases
2 where p.Customer.Address.State == "WA" || p.Customer == null
3 where p.PurchaseItems.Sum (pi => pi.SaleAmount) > 1000
4 select p

将此与同等功能的 SQL 相比较：

 1 SELECT p.*
 2 FROM Purchase p
 3     LEFT OUTER JOIN 
 4         Customer c INNER JOIN Address a ON c.AddressID = a.ID
 5     ON p.CustomerID = c.ID    
 6 WHERE
 7    (a.State = 'WA' || p.CustomerID IS NULL)
 8     AND p.ID in
 9     (
10         SELECT PurchaseID FROM PurchaseItem
11         GROUP BY PurchaseID HAVING SUM (SaleAmount) > 1000
12     )

对此例进一步扩展，假设我们想要将结果集按价格进行逆序排列，并在最终的投影中显示销售员的姓名以及所购买项目的数量。我们可以自然不重复地表达出这些附件的查询条件：

 1 from p in db.Purchases
 2 where p.Customer.Address.State == "WA" || p.Customer == null
 3 let purchaseValue = p.PurchaseItems.Sum (pi => pi.SaleAmount)
 4 where purchaseValue > 1000
 5 orderby purchaseValue descending
 6 select new
 7 {
 8    p.Description,
 9    p.Customer.SalesPerson.Name,
10    PurchaseItemCount = p.PurchaseItems.Count()
11 }

下面是使用 SQL 实现相同的查询：

 1 SELECT 
 2     p.Description,
 3     s.Name,
 4     (SELECT COUNT(*) FROM PurchaseItem pi WHERE p.ID = pi.PurchaseID) PurchaseItemCount    
 5 FROM Purchase p
 6     LEFT OUTER JOIN 
 7         Customer c 
 8             INNER JOIN Address a ON c.AddressID = a.ID
 9             LEFT OUTER JOIN SalesPerson s ON c.SalesPersonID = s.ID
10     ON p.CustomerID = c.ID    
11 WHERE
12     (a.State = 'WA' OR p.CustomerID IS NULL)
13     AND p.ID in
14     (
15         SELECT PurchaseID FROM PurchaseItem
16         GROUP BY PurchaseID HAVING SUM (SaleAmount) > 1000
17     )
18 ORDER BY
19     (SELECT SUM (SaleAmount) FROM PurchaseItem pi WHERE p.ID = pi.PurchaseID) DESC

有意思的是可以将上述 SQL 查询转换回到 LINQ，所生成的查询每一块都会有傻瓜式重复。论坛里常会贴出这样的查询（通常是非工作的版本）——这是用 SQL 进行思考而不是以 LINQ 进行思考的结果。这就像是是将 Fortran 程序转换成 C# 6 时会抱怨 GOTO 的笨拙语法一样。

数据修整

在查询联合中从多个表选择数据 - 最终的结果会是一个扁平的以行为单位的元组。如果你使用了多年的 SQL，你可能认为这种事不会发生在你身上——它导致数据重复，从而使得结果集无法在客户端很好地使用。所以当它发生时往往难以接受。与此相反，LINQ 让你可以获取到休整过的分层级的数据。这就避免了重复，让结果集容易处理，而且在大多数情况下也会消除进行联合操作的必要。例如，假设我们想要提取一组顾客，每一条记录都带上了它们的高价值交易。使用 LINQ，你可以这样做：

1 from c in db.Customers
2 where c.Address.State == "WA"
3 select new
4 {
5    c.Name,
6    c.CustomerNumber,
7    HighValuePurchases = c.Purchases.Where (p => p.Price > 1000)
8 }

HighValuePurchases，在这里是一个集合。由于我们查询的是一个相关属性，就不需要进行联合了。因此这是一个内联合还是外联合的细节问题就被很好的抽象掉了。在此例中，当翻译成了 SQL，可能就是一个外联合：LINQ 不会因为子集合返回的是零个元素就排除行。如果我们想要有一个可以翻译成一个内联合的东西，可以这样做:

1 from c in db.Customers
2 where c.Address.State == "WA"
3 let HighValuePurchases = c.Purchases.Where (p => p.Price > 1000)where HighValuePurchases.Any()select new
4 {
5    c.Name,
6    c.CustomerNumber,
7    HighValuePurchases
8 }

参数化

如果我们想要将之前的例子参数化会如何呢，如此"WA"状态是不是就要来自于一个变量呢? 其实我们只要像下面这样做就可以了:

1 string state = "WA";
2 
3 var query =
4    from c in db.Customers
5    where c.Address.State == state
6    ...

不会混淆 DbCommand 对象上面的参数，或者担心 SQL 注入攻击。 LINQ 的参数化是内联、类型安全并且高度可读的。它不仅解决了问题——而且解决得很不错。

因为 LINQ 查询时可以进行组合，所以我们可以有条件的添加谓词。例如，我们写出一个方法，如下：

 1 IQueryable<Customer> GetCustomers (string state, decimal? minPurchase)
 2 {
 3     var query = Customers.AsQueryable();
 4     
 5     if (state != null)
 6         query = query.Where (c => c.Address.State == state);
 7     
 8     if (minPurchase != null)
 9         query = query.Where (c => c.Purchases.Any (p => p.Price > minPurchase.Value));
10     
11     return query;
12 }

如果我们使用空的 state 以及 minPurchase 值调用了这个方法，那么在我们枚举结果集的时候如下 SQL 就会被生成出来：

1 SELECT [t0].[ID], [t0].[Name], [t0].[AddressID]
2 FROM [Customer] AS [t0]

不过，如果我们指定了 state 和 minPurchase 的值，LINQ 到 SQL 就不只是向查询添加了谓词，还会有必要的联合语句：

1 SELECT [t0].[ID], [t0].[Name], [t0].[AddressID]
2 FROM [Customer] AS [t0]
3 LEFT OUTER JOIN [Address] AS [t1] ON [t1].[ID] = [t0].[AddressID]
4 WHERE (EXISTS(
5     SELECT NULL AS [EMPTY]
6     FROM [Purchase] AS [t2]
7     WHERE ([t2].[Price] > @p0) AND ([t2].[CustomerID] = [t0].[ID])
8     )) AND ([t1].[State] = @p1)

因为我们的方法返回了一个 IQueryable，查询在枚举到之前并不会被实际地转换成 SQL 并加以执行。这样就给了调用进一步添加谓词、分页、自定义投影等等的机会。

静态类型安全

在之前的查询中，如果我们将 state 变量声明成了一个整型数而不是一个字符串，那么查询可能在编译时就会报错，而不用等到运行时。这个也同样适用于把表名或者列名弄错的情况。这在重构时有一个很实在的好处：如果你没有完成手头的工作，编译器会给出提示。

客户端处理

LINQ 让你可以轻松地将查询的一些部分转移到客户端上进行处理。对于负载负担较大的数据库服务器，这样做可实际提升性能。只要你所取数据没有超过所需（换言之，你还是要在服务器上做过滤），就可以经常性地通过把对结果集进行重新排序、转换以及重组的压力转移到负载较少的应用服务器上去。使用 LINQ，你需要做的就是 AsEnumerable() 转移到查询之中，而自那个点之后的所有事情都可以在本地执行。

什么时候不用 LINQ 去查询数据库

尽管 LINQ 的功能强大，但是它并不能取代 SQL。它可以满足 95% 以上的需求，不过你有时仍然需要SQL:

需要手动调整的查询（特殊是需要优化和进行锁定提示的时候）；
有些涉及到要 select 临时表，然后又要对那些表进行查询操作的查询；
预知的更新以及批量插入操作。

还有就在用到触发器时，你还是需要 SQL。 (尽管在使用 LINQ 的时候诸如此类的东西并非常常被需要，但在要使用存储过程和函数的时候，SQL 是不可或缺的)。你可以通过在 SQL 中编写表值函数来将 SQL 与 LINQ 结合在一起, 然后在更加复杂的 LINQ 查询里面调用这些函数。

了解两门查询语言并不是问题，因为无论如何你都会想要去学习 LINQ 的 — LINQ 在查询本地集合以及 XML DOM 的时候非常实用。如果你使用的仍然是老旧的基于 XmlDocument 的 DOM，LINQ to XML 的 DOM 操作会是一种具有戏剧效果的进步。

还有就是相比于 SQL， LINQ 更易于掌握，所以如果你想写个不错的查询，使用 LINQ 会比 SQL 更好达成。

将 LINQ 用于实战

我几乎是只用 LINQ 来做数据库查询，因为它更有效率。

对于应用程序的编写而言，我的个人经验是一个使用 LINQ 的数据访问层（使用一个像 LINQ 到 SQL 或者 Entity Framework 的 API）可以将数据访问的开发时间砍掉一半，而且可以让维护工作更加的轻松。

（个人认为：用SQL还是用LINQ也是要分业务场景的，或者也可以用视图来实现。）

转载链接：http://www.oschina.net/translate/why-linq-beats-sql?lang=chs

posted on 2018-02-09 13:39 SuperSnowYao 阅读(765) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 单线程的Redis速度为什么快？

SuperSnow

为什么说 LINQ 要胜过 SQL

导航

公告

搜索

常用链接

我的标签

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论