C#3.0入门系列（九）-之GroupBy操作

有朋友反馈说我提供的sample不能编译。大概是版本的问题，可以到http://msdn2.microsoft.com/en-us/bb330936.aspx下载for beta1的版本。本节接着讲groupby。
上一节，我们讲了如何理解groupby返回的结果。本节会延这个思路阐述下去。先来看下面的例子

GroupBy操作中Select的匿名类

var q = from p in db.Products

group p by p.CategoryID into g

select new { CategoryID = g.Key, g };

本例中，select操作中使用了匿名类。本系列中第一次提到匿名类是在http://www.cnblogs.com/126/archive/2006/12/20/503519.html 一文中。本文将再一次，阐述匿名类的理解。所谓匿名类，其实质，并不是匿名，而是编译器帮你去创建了这么一个类，在用户看来，好像并没有去创建，此所谓匿名类。也就是说，编译器在编译时，还是有这个类的，这个类是编译器自己创建的，其名称是编译器界定的。在上例的匿名类中，有2个property，一个叫CategoryID, 一个叫g。大家要注意了，这个匿名类，其实质是对返回结果重新进行了包装。而那个叫做g的property，就封装了一个完整的分组。如图，仔细比较和上篇图的区别。

如果，使用下面的语句。

var q = from p in db.Products

group p by p.CategoryID into g

select new { CategoryID = g.Key,GroupSet = g };

只是把g重新命名为GroupSet．需要用下面的遍历，获取每个产品纪录。

foreach (var gp in q)

{

if (gp.CategoryID == 7)

{

foreach (var p in gp.GroupSet)

{

}

这里groupby的操作相对难理解些，主要原因，它包含了整个分组的具体信息，而不是简单的求和，取平均值等。如果在最终结果中，也就是在select语句中，不包含g的全部信息，而只是g的聚合函数。又会是怎么样的一番风景呢？
GroupBy中的Max, Min, Sum, Average,Count
如果，只想取每类产品中，单价为最大，用T-sql该怎么办呢？是不是要这么来写

SELECT MAX([t0].[UnitPrice]) AS [MaxPrice], [t0].[CategoryID]

FROM [dbo].[Products] AS [t0]

GROUP BY [t0].[CategoryID]

我们来看看，dlinq如何来做同样的事情．如下，先按CategoryID归类，然后，只取CategoryID值和同类产品中单价最大的。

var q =

from p in db.Products

group p by p.CategoryID into g

select new {

g.Key,

MaxPrice = g.Max(p => p.UnitPrice)

};

在这里，Max函数只对每个分组进行操作。我们来看看其结果

呀，这次，dlinq并没有把组里所有的纪录都取出来的吗。（请参考http://www.cnblogs.com/126/archive/2006/09/01/486388.html一文中的方法，配置sample.） dlinq只是简单做了统计，并返回结果。
每类产品中，单价为最小的，

var q =

from p in db.Products

group p by p.CategoryID into g

select new {

g.Key,

MinPrice = g.Min(p => p.UnitPrice)

};

每类产品的价格平均值

var q =

from p in db.Products

group p by p.CategoryID into g

select new {

g.Key,

AveragePrice = g.Average(p => p.UnitPrice)

};

每类产品，价格之和

var q =

from p in db.Products

group p by p.CategoryID into g

select new {

g.Key,

TotalPrice = g.Sum(p => p.UnitPrice)

};

各类产品，数量之和

var q =

from p in db.Products

group p by p.CategoryID into g

select new {

g.Key,

NumProducts = g.Count()

};

如果用OrderDetails表做统计，会更好些，因为，不光可以统计同一种产品，还可以统计同一订单。
接着统计，同各类产品中，断货的产品数量。使用下面的语句。

var q =

from p in db.Products

group p by p.CategoryID into g

select new {

g.Key,

NumProducts = g.Count(p => p.Discontinued)

};

在这里，count函数里，使用了Lambda表达式。在上篇中，我们已经阐述了g是一个组的概念。那在该Lambda表达式中的p，就代表这个组里的一个元素或对象，即某一个产品。还可以使用where条件来限制最终筛选结果

var q =

from p in db.Products

group p by p.CategoryID into g

where g.Count() >= 10

select new {

g.Key,

ProductCount = g.Count()

};

这句在翻译成sql语句时，欠套了一层，在最外层加了条件。

SELECT [t1].[CategoryID], [t1].[value2] AS [ProductCount]

FROM (

SELECT COUNT(*) AS [value], COUNT(*) AS [value2], [t0].[CategoryID]

FROM [dbo].[Products] AS [t0]

GROUP BY [t0].[CategoryID]

) AS [t1]

WHERE [t1].[value] >= @p0

-- @p0: Input Int32 (Size = 0; Prec = 0; Scale = 0) [10]

-- Context: SqlProvider(Sql2005) Model: AttributedMetaModel Build: 2.0.20612.0

GroupBy操作中GroupBy的匿名类
在第一次谈到匿名类时，我们就提到不光Select操作可以使用匿名类，其他操作符也可以。但是，OrderBy不支持。请参考C#3.0入门系列（六）-之OrderBy操作

当用户既想按产品的分类，又想按供应商来做分组，该怎么办呢。这时，我们就该使用匿名类。

var categories =

from p in db.Products

group p by new { p.CategoryID, p.SupplierID } into g

select new {g.Key, g};

在by后面，new出来一个匿名类。这里，Key其实质是一个类的对象，Key包含两个Property,一个是CategoryID，再一个是SupplierID ，要想取到具体CategoryID的值，需要g.Key.CategoryID，才能访问到。我们来看dlinq翻译的T-sql语句。

SELECT [t0].[SupplierID], [t0].[CategoryID]

FROM [dbo].[Products] AS [t0]

GROUP BY [t0].[CategoryID], [t0].[SupplierID]

-- Context: SqlProvider(Sql2005) Model: AttributedMetaModel Build: 2.0.20612.0

先按CategoryID，再按SupplierID ，和匿名类中的循序一样。
最后一个例子。

var categories =

from p in db.Products

group p by new { Criterion = p.UnitPrice > 10 } into g

select g;

按产品单价是否大于１０分类。其结果为两类，大于的是一类，小于及等于为另一类。好了，剩下的，大家自己多去领会。

posted @ 2007-07-10 18:17 Tom Song 阅读(11156) 评论(15) 编辑收藏举报

刷新页面返回顶部

兴国安邦

C# 3.0, Linq, Linq To Sql

C#3.0入门系列（九）-之GroupBy操作

公告