转载Linq中GroupBy方法的使用总结
Group在SQL经常使用,通常是对一个字段或者多个字段分组,求其总和,均值等。
Linq中的Groupby方法也有这种功能。具体实现看代码:
假设有如下的一个数据集:
- public class StudentScore
- {
- public int ID { set; get; }
- public string Name { set; get; }
- public string Course { set; get; }
- public int Score { set; get; }
- public string Term { set; get; }
- }
- List<StudentScore> lst = new List<StudentScore>() {
- new StudentScore(){ID=1,Name="张三",Term="第一学期",Course="Math",Score=80},
- new StudentScore(){ID=1,Name="张三",Term="第一学期",Course="Chinese",Score=90},
- new StudentScore(){ID=1,Name="张三",Term="第一学期",Course="English",Score=70},
- new StudentScore(){ID=2,Name="李四",Term="第一学期",Course="Math",Score=60},
- new StudentScore(){ID=2,Name="李四",Term="第一学期",Course="Chinese",Score=70},
- new StudentScore(){ID=2,Name="李四",Term="第一学期",Course="English",Score=30},
- new StudentScore(){ID=3,Name="王五",Term="第一学期",Course="Math",Score=100},
- new StudentScore(){ID=3,Name="王五",Term="第一学期",Course="Chinese",Score=80},
- new StudentScore(){ID=3,Name="王五",Term="第一学期",Course="English",Score=80},
- new StudentScore(){ID=4,Name="赵六",Term="第一学期",Course="Math",Score=90},
- new StudentScore(){ID=4,Name="赵六",Term="第一学期",Course="Chinese",Score=80},
- new StudentScore(){ID=4,Name="赵六",Term="第一学期",Course="English",Score=70},
- new StudentScore(){ID=1,Name="张三",Term="第二学期",Course="Math",Score=100},
- new StudentScore(){ID=1,Name="张三",Term="第二学期",Course="Chinese",Score=80},
- new StudentScore(){ID=1,Name="张三",Term="第二学期",Course="English",Score=70},
- new StudentScore(){ID=2,Name="李四",Term="第二学期",Course="Math",Score=90},
- new StudentScore(){ID=2,Name="李四",Term="第二学期",Course="Chinese",Score=50},
- new StudentScore(){ID=2,Name="李四",Term="第二学期",Course="English",Score=80},
- new StudentScore(){ID=3,Name="王五",Term="第二学期",Course="Math",Score=90},
- new StudentScore(){ID=3,Name="王五",Term="第二学期",Course="Chinese",Score=70},
- new StudentScore(){ID=3,Name="王五",Term="第二学期",Course="English",Score=80},
- new StudentScore(){ID=4,Name="赵六",Term="第二学期",Course="Math",Score=70},
- new StudentScore(){ID=4,Name="赵六",Term="第二学期",Course="Chinese",Score=60},
- new StudentScore(){ID=4,Name="赵六",Term="第二学期",Course="English",Score=70},
- };
可以把这个数据集想象成数据库中的一个二维表格。
示例一
通常我们会把分组后得到的数据放到匿名对象中,因为分组后的数据的列不一定和原始二维表格的一致。当然要按照原有数据的格式存放也是可以的,只需select的时候采用相应的类型即可。
第一种写法很简单,只是根据下面分组。
- //分组,根据姓名,统计Sum的分数,统计结果放在匿名对象中。两种写法。
- //第一种写法
- Console.WriteLine("---------第一种写法");
- var studentSumScore_1 = (from l in lst
- group l by l.Name into grouped
- orderby grouped.Sum(m => m.Score)
- select new { Name = grouped.Key, Scores = grouped.Sum(m => m.Score) }).ToList();
- foreach (var l in studentSumScore_1)
- {
- Console.WriteLine("{0}:总分{1}", l.Name, l.Scores);
- }
- 第二种写法和第一种其实是等价的。
- //第二种写法
- Console.WriteLine("---------第二种写法");
- var studentSumScore_2 = lst.GroupBy(m => m.Name)
- .Select(k => new { Name = k.Key, Scores = k.Sum(l => l.Score) })
- .OrderBy(m => m.Scores).ToList();
- foreach (var l in studentSumScore_2)
- {
- Console.WriteLine("{0}:总分{1}", l.Name, l.Scores);
- }
示例二
当分组的字段是多个的时候,通常把这多个字段合并成一个匿名对象,然后group by这个匿名对象。
注意:groupby后将数据放到grouped这个变量中,grouped 其实是IGrouping<TKey, TElement>类型的,IGrouping<out TKey, out TElement>继承了IEnumerable<TElement>,并且多了一个属性就是Key,这个Key就是当初分组的关键字,即那些值都相同的字段,此处就是该匿名对象。可以在后续的代码中取得这个Key,便于我们编程。
orderby多个字段的时候,在SQL中是用逗号分割多个字段,在Linq中就直接多写几个orderby。
- //分组,根据2个条件学期和课程,统计各科均分,统计结果放在匿名对象中。两种写法。
- Console.WriteLine("---------第一种写法");
- var TermAvgScore_1 = (from l in lst
- group l by new { Term = l.Term, Course = l.Course } into grouped
- orderby grouped.Average(m => m.Score) ascending
- orderby grouped.Key.Term descending
- select new { Term = grouped.Key.Term, Course = grouped.Key.Course, Scores = grouped.Average(m => m.Score) }).ToList();
- foreach (var l in TermAvgScore_1)
- {
- Console.WriteLine("学期:{0},课程{1},均分{2}", l.Term, l.Course, l.Scores);
- }
- Console.WriteLine("---------第二种写法");
- var TermAvgScore_2 = lst.GroupBy(m => new { Term = m.Term, Course = m.Course })
- .Select(k => new { Term = k.Key.Term, Course = k.Key.Course, Scores = k.Average(m => m.Score) })
- .OrderBy(l => l.Scores).OrderByDescending(l => l.Term);
- foreach (var l in TermAvgScore_2)
- {
- Console.WriteLine("学期:{0},课程{1},均分{2}", l.Term, l.Course, l.Scores);
- }
示例三
Linq中没有SQL中的Having语句,因此是采用where语句对Group后的结果过滤。
- //分组,带有Having的查询,查询均分>80的学生
- Console.WriteLine("---------第一种写法");
- var AvgScoreGreater80_1 = (from l in lst
- group l by new { Name = l.Name, Term = l.Term } into grouped
- where grouped.Average(m => m.Score)>=80
- orderby grouped.Average(m => m.Score) descending
- select new { Name = grouped.Key.Name, Term = grouped.Key.Term, Scores = grouped.Average(m => m.Score) }).ToList();
- foreach (var l in AvgScoreGreater80_1)
- {
- Console.WriteLine("姓名:{0},学期{1},均分{2}", l.Name, l.Term, l.Scores);
- }
- Console.WriteLine("---------第二种写法");
- //此写法看起来较为复杂,第一个Groupby,由于是要对多个字段分组的,因此构建一个匿名对象,
- 对这个匿名对象分组,分组得到的其实是一个IEnumberable<IGrouping<匿名类型,StudentScore>>这样一个类型。
- Where方法接受,和返回的都同样是IEnumberable<IGrouping<匿名类型,StudentScore>>类型,
- 其中Where方法签名Func委托的类型也就成了Func<IGrouping<匿名类型,StudentScore>,bool>,
- 之前说到,IGrouping<out TKey, out TElement>继承了IEnumerable<TElement>,
- 因此这种类型可以有Average,Sum等方法。
- var AvgScoreGreater80_2 = lst.GroupBy(l => new { Name = l.Name, Term = l.Term })
- .Where(m => m.Average(x => x.Score) >= 80)
- .OrderByDescending(l=>l.Average(x=>x.Score))
- .Select(l => new { Name = l.Key.Name, Term = l.Key.Term, Scores = l.Average(m => m.Score) }).ToList();
- foreach (var l in AvgScoreGreater80_2)
- {
- Console.WriteLine("姓名:{0},学期{1},均分{2}", l.Name, l.Term, l.Scores);
- }