LINQ基础(二)
本文主要介绍LINQ查询操作符
LINQ查询为最常用的操作符定义了一个声明语法。还有许多查询操作符可用于Enumerable类。
下面的例子需要用到LINQ基础(一)(http://www.cnblogs.com/afei-24/p/6841361.html)的一些代码
1.筛选
LINQ查询使用where子句添加条件表达式来筛选,where子句可以合并多个表达式。
var racers = from r in Formula1.GetChampions() where r.Wins>15 && (r.Country == "Brazil" || r.Country =="Austria") select r; foreach(var r in racers) { Console.WriteLine("{0:A}", r); }
上述LINQ表达式映射为C# LINQ查询的扩展方法:
var racers = Formula1.GetChampions().Where(r =>r.Wins>15 &&
(r.Country == "Brazil" || r.Country =="Austria")).Select(r => r);
注意,并不是所以查询都可以使用LINQ查询语法,也不是所有的扩展方法都映射到LINQ查询。高级查询需要使用扩展方法。
2.用索引筛选
不能使用LINQ查询的一个例子是Where()方法的重载。在WHere()方法的重载中,可以传递第二个参数————索引。索引是筛选器返回的每个结果的计数器。可以在表达式中使用这个索引,执行基于索引的计算:
var racers = Formula1.GetChampions(). Where((r, index) => r.LastName.StartsWith("A") && index % 2 != 0); foreach (var r in racers) { Console.WriteLine("{0:A}", r); }
3.类型筛选
为了进行基于类型的筛选,可以使用OfType()扩展方法。
object[] data = { "one", 2, 3, "four", "five", 6 }; var query = data.OfType<string>(); foreach (var s in query) { Console.WriteLine(s); }
输出:
one
four
five
从集合仅返回字符串。
4.复合的from子句
如果需要根据对象的成员进行筛选,而该成员本身是一个系列,就可以使用复合from子句。例如,LINQ基础(一)(http://www.cnblogs.com/afei-24/p/6841361.html)中的Racer类定义了一个属性Cars,Cars是一个字符串数组。
筛选驾驶Ferrari的所以冠军:
var ferrariDrivers = from r in Formula1.GetChampions() from c in r.Cars where c == "Ferrari" orderby r.LastName select r.FirstName + " " + r.LastName; foreach (var racer in ferrariDrivers) { Console.WriteLine(racer); }
第一个from子句访问Formula1.GetChampions()方法返回的Racer对象,第二个from子句访问Racer类的Cars属性,以返回所以sting类型的赛车。
C#编译器把复合的from子句和LINQ查询转换为SelectMany()扩展方法。SelectMany()扩展方法可以迭代序列中的序列。
SelectMany()的重载版本:
public static IEnumerable<TResult> SelectMany<TSource, TCollection, TResult>(this IEnumerable<TSource> source,
Func<TSource, IEnumerable<TCollection>> collectionSelector,
Func<TSource, TCollection, TResult> resultSelector);
第一个参数是隐式参数,它从Formula1.GetChampions()方法接受Racer对象序列。第二个参数是collectionSelector委托,其中定义了内部序列,是序列的序列,本例子为Cars。第三个参数也是一个委托,为每个Racer对象的Cars属性的每个元素调用这个委托。
这里Cars是一个字符串数组,会将每个Racer和每个字符串作为参数,调用这个委托。
var ferrariDrivers = Formula1.GetChampions().SelectMany( c => c.Cars, (r, s) => new { Racer=r,Car =s}).Where( s =>s.Car == "Ferrari").OrderBy( r => r.Racer.LastName).Select(r => r.Racer.FirstName + " " + r.Racer.LastName); foreach (var racer in ferrariDrivers) { Console.WriteLine(racer); }
5.排序
要对序列排序,可以使用前面使用过的orderby.也可以使用orderrby descending子句(降序)。
var racers = (from r in Formula1.GetChampions() orderby r.Country descending select r); foreach (var racer in racers) { Console.WriteLine("{0}: {1}, {2}", racer.Country, racer.LastName, racer.FirstName); }
orderby子句解析为OrderBy()方法,orderby r.Country descending解析为OrderByDescending()方法:
var racers = Formula1.GetChampions().OrderByDescending(r => r.Country).Select(r=>r);
OrderBy()和OrderByDescending()方法返回IOrderEnumerable<TSource>。这个接口派生自IEnumerable<TSource>接口,但包含一个额外的方法CreateOrderEnumerable<TSource>()方法。这个方法用于进一步给序列排序,可以在最后一个参数指定升序还是降序:
// 摘要: // 根据某个键对 System.Linq.IOrderedEnumerable<TElement> 的元素执行后续排序。 // // 参数: // keySelector: // 用于提取每个元素的键的 System.Func<T,TResult>。 // // comparer: // 用于比较键在返回序列中的位置的 System.Collections.Generic.IComparer<T>。 // // descending: // 如果为 true,则对元素进行降序排序;如果为 false,则对元素进行升序排序。 // // 类型参数: // TKey: // keySelector 生成的键的类型。 // // 返回结果: // 一个 System.Linq.IOrderedEnumerable<TElement>,其元素按键排序。 IOrderedEnumerable<TElement> CreateOrderedEnumerable<TKey>(Func<TElement, TKey> keySelector, IComparer<TKey> comparer, bool descending);
例子:
// Create an array of strings to sort. string[] fruits = { "apricot", "orange", "banana", "mango", "apple", "grape", "strawberry" }; // First sort the strings by their length. IOrderedEnumerable<string> sortedFruits2 = fruits.OrderBy(fruit => fruit.Length); // Secondarily sort the strings alphabetically, using the default comparer. IOrderedEnumerable<string> sortedFruits3 = sortedFruits2.CreateOrderedEnumerable<string>( fruit => fruit, Comparer<string>.Default, false);
使用ThenBy和ThenByDescending()方法进行进一步排序,可以添加任意多个:
var racers = Formula1.GetChampions().OrderByDescending(r => r.Country).ThenByDescending(
r => r.LastName).ThenByDescending(r => r.FirstName).Select(r => r);
6.分组
要根据一个关键字值对查询结果分组,可以使用group子句。
// group r by r.Country into g 根据Country属性组合所有的赛车手,并定义为一个新的集合g,用于访问分组的结果信息。 //select子句创建一个带Country和Count属性的匿名类型。Country = g.Key Key是r.Country var countries = from r in Formula1.GetChampions() group r by r.Country into g orderby g.Count() descending, g.Key where g.Count() >= 2 select new { Country = g.Key, Count = g.Count() }; foreach (var item in countries) { Console.WriteLine("{0, -10} {1}", item.Country, item.Count); }
输出:
使用扩展方法执行相同的操作,把group r by r.Country 子句解析为GroupBy()方法。在GroupBy()方法的声明中,它返回实现了IGrouping<TKey, TSource>接口的枚举对象。IGrouping<TKey, TSource>接口定义了Key属性,所以在调用了这个方法后,可以访问分组的关键字:
public static IEnumerable<IGrouping<TKey, TSource>> GroupBy<TSource, TKey>(this IEnumerable<TSource> source,
Func<TSource, TKey> keySelector);
使用GroupBy方法:
var countries = Formula1.GetChampions().GroupBy(r => r.Country).OrderByDescending( g => g.Count()).ThenBy(g => g.Key).Where(g => g.Count() >= 2).Select( g=>new { Country = g.Key, Count = g.Count() });
7.对嵌套的对象分组
如果得到的分组的对象需要包含嵌套的序列,就可以改变select子句创建匿名类型。
//返回的对象不仅需要包含国家名和赛车手这两个属性,还应包含赛车手集合。 //使用from r1 in g orderby r1.LastName select r1.FirstName + " " + r1.LastName 内部子句 var countries = from r in Formula1.GetChampions() group r by r.Country into g orderby g.Count() descending, g.Key where g.Count() >= 2 select new { Country = g.Key, Count = g.Count(), Racers = from r1 in g orderby r1.LastName select r1.FirstName + " " + r1.LastName }; foreach (var item in countries) { Console.WriteLine("{0, -10} {1}", item.Country, item.Count); foreach (var name in item.Racers) { Console.Write("{0}; ", name); } Console.WriteLine(); }
8.内连接
使用join子句可以根据特定的条件合并两个数据源,但之前要获得两个连接的列表。
使用了LINQ基础(一)(http://www.cnblogs.com/afei-24/p/6841361.html)的代码
//GetChampions获得冠军赛车手 var racers = from r in Formula1.GetChampions() from y in r.Years select new { Year = y, Name = r.FirstName + " " + r.LastName }; //GetContructorChampions获取冠军车队 var teams = from t in Formula1.GetContructorChampions() from y in t.Years select new { Year = y, Name = t.Name }; //得到每一年获得冠军的赛车手和车队 //通过join t in teams on r.Year equals t.Year into rt 子句连接两个数据源 var racersAndTeams = (from r in racers join t in teams on r.Year equals t.Year into rt from t in rt.DefaultIfEmpty() orderby r.Year select new { Year = r.Year, Champion = r.Name, Constructor = t == null ? "no constructor championship" : t.Name }); Console.WriteLine("Year Champion\t\t Constructor Title"); foreach (var item in racersAndTeams) { Console.WriteLine("{0}: {1,-20} {2}", item.Year, item.Champion, item.Constructor); }
9.左连接
使用内连接返回匹配r.Year equals t.Year的结果。左连接返回左边数据源的全部元素,即使在右边的数据源中没有匹配的元素。
var racers = from r in Formula1.GetChampions() from y in r.Years select new { Year = y, Name = r.FirstName + " " + r.LastName }; var teams = from t in Formula1.GetContructorChampions() from y in t.Years select new { Year = y, Name = t.Name }; //左连接用join和DefaultIfEmpty方法定义。 //如果查询到左侧数据源没有和右边数据源Year相同的结果,使用DefaultIfEmpty方法定义右侧的默认值(为空) var racersAndTeams = (from r in racers join t in teams on r.Year equals t.Year into rt from t in rt.DefaultIfEmpty() orderby r.Year select new { Year = r.Year, Champion = r.Name, Constructor = t == null ? "no constructor championship" : t.Name }); Console.WriteLine("Year Champion\t\t Constructor Title"); foreach (var item in racersAndTeams) { Console.WriteLine("{0}: {1,-20} {2}", item.Year, item.Champion, item.Constructor); }
10.组连接
组连接类似内连接,内连接通过某一项连接两个数据源(如 r.Year equals t.Year),组连接使用一组项连接,例如下面的例子,
通过 new
{
FirstName = r.FirstName,
LastName = r.LastName
}
equals
new
{
FirstName = r2.FirstName,
LastName = r2.LastName
}
连接两个数据源
var racers = Formula1.GetChampionships() .SelectMany(cs => new List<RacerInfo>() { new RacerInfo { Year = cs.Year, Position = 1, FirstName = cs.First.FirstName(), LastName = cs.First.LastName() }, new RacerInfo { Year = cs.Year, Position = 2, FirstName = cs.Second.FirstName(), LastName = cs.Second.LastName() }, new RacerInfo { Year = cs.Year, Position = 3, FirstName = cs.Third.FirstName(), LastName = cs.Third.LastName() } }); var q = (from r in Formula1.GetChampions() join r2 in racers on new { FirstName = r.FirstName, LastName = r.LastName } equals new { FirstName = r2.FirstName, LastName = r2.LastName } into yearResults select new { FirstName = r.FirstName, LastName = r.LastName, Wins = r.Wins, Starts = r.Starts, Results = yearResults }); foreach (var r in q) { Console.WriteLine("{0} {1}", r.FirstName, r.LastName); foreach (var results in r.Results) { Console.WriteLine("{0} {1}", results.Year, results.Position); } }
11.集合操作
扩展方法Distinct(),Union(),Intersect()(获取交集),Except()都是集合操作。
//获取同时驾驶Ferrari和驾驶McLaren获得过冠军的赛车手 static void SetOperations() { //定义一个委托,用来查询驾驶Ferrari获得过冠军的赛车手和驾驶McLaren获得过冠军的赛车手 Func<string, IEnumerable<Racer>> racersByCar = car => from r in Formula1.GetChampions() from c in r.Cars where c == car orderby r.LastName select r; Console.WriteLine("World champion with Ferrari and McLaren"); //使用Intersect方法获取两个数据源的交集 foreach (var racer in racersByCar("Ferrari").Intersect(racersByCar("McLaren"))) { Console.WriteLine(racer); } }
12.合并
Zip()方法是.NET 4.0新增的,允许用一个为此函数把两个相关的序列合并为一个。
对于合并,第一个集合中的第一项与第二个集合的第一项合并,第一个集合中的第二项与第二个集合的第二项合并,以此类推。如果两个序列的项数不同,Zip()方法就会在达到较小集合的末尾时停止。
第一个集合中的元素有一个Name属性,第二个集合中的元素有LastName和Starts属性。
在racerNames集合上使用Zip()方法,需要把第二个集合racerNamesAndStarts作为第一个参数。第二个参数是一个委托,它通过参数first接受第一个集合的元素,通过参数second接受第二个集合的元素。其实现代码返回一个字符串:
var racerNames = from r in Formula1.GetChampions() where r.Country == "Italy" orderby r.Wins descending select new { Name = r.FirstName + " " + r.LastName }; var racerNamesAndStarts = from r in Formula1.GetChampions() where r.Country == "Italy" orderby r.Wins descending select new { LastName = r.LastName, Starts = r.Starts }; var racers = racerNames.Zip(racerNamesAndStarts, (first, second) => first.Name + ", starts: " + second.Starts); foreach (var r in racers) { Console.WriteLine(r); }
13.分区
扩展方法Take()和Skip()等的分区操作可用于分页。
例如,在第一页只显示5个赛车手,下一页显示接下来的5个赛车手...
Skip(page * pageSize)方法调到指定索引出,忽略前面的数据。Take(pageSize)方法显示pageSize条数据
int pageSize = 5; int numberPages = (int)Math.Ceiling(Formula1.GetChampions().Count() / (double)pageSize); for (int page = 0; page < numberPages; page++) { Console.WriteLine("Page {0}", page); var racers = (from r in Formula1.GetChampions() orderby r.LastName, r.FirstName select r.FirstName + " " + r.LastName). Skip(page * pageSize).Take(pageSize); foreach (var name in racers) { Console.WriteLine(name); } Console.WriteLine(); }
TakeWhile()和SkipWhile()方法,传递一个委托,满足这个条件的数据就提取或跳转:
public static IEnumerable<TSource> SkipWhile<TSource>(this IEnumerable<TSource> source, Func<TSource, bool> predicate);
14.聚合操作符
聚合操作符(如Count(),Sum(),Min(),Max(),Average(),Aggregate())不返回一个序列,而是返回一个值。
例如,使用Count方法应用于Racer的Years属性,筛选获得冠军次数超过3次的赛车手。因为多次使用r.Years.Count(),所以使用let子句定义了一个变量。
var query = from r in Formula1.GetChampions() let numberYears = r.Years.Count() where numberYears >= 3 orderby numberYears descending, r.LastName select new { Name = r.FirstName + " " + r.LastName, TimesChampion = numberYears }; foreach (var r in query) { Console.WriteLine("{0} {1}", r.Name, r.TimesChampion); }
Aggregate()方法传递一个委托,将数据源中的每个元素作为委托的参数,并使用指定的函数累加。
15.转换操作符
LINQ基础(一)(http://www.cnblogs.com/afei-24/p/6841361.html)提到,查询会推迟到迭代数据项时才执行,使用转换操作符会立即执行查询,把查询结果放在数组,列表和字典中。
//转换为数组 var names = new List<string> { "Nino", "Alberto", "Juan", "Mike", "Phil" }; var namesWithJ = (from n in names where n.StartsWith("J") orderby n select n).ToList();
转换为Lookup<TKey,TElement>
//把Car赛车属性作为键,每个键关联多个车手Racer var racers = (from r in Formula1.GetChampions() from c in r.Cars select new { Car = c, Racer = r }).ToLookup(cr => cr.Car, cr => cr.Racer); foreach (var v in racers) { Console.Write(v.Key+"........"); foreach (var k in racers[v.Key]) { Console.WriteLine(k); } }
ToLookup(cr => cr.Car, cr => cr.Racer)方法的一个重载版本传递一个键和一个元素选择器
如果需要在非类型化的集合上使用LINQ查询,可以使用Cast()方法,定义强类型化的查询:
var list = new System.Collections.ArrayList(Formula1.GetChampions() as System.Collections.ICollection); var query = from r in list.Cast<Racer>() where r.Country == "USA" orderby r.Wins descending select r; foreach (var racer in query) { Console.WriteLine("{0:A}", racer); }
Cast<Racer>()将 System.Collections.IEnumerable 的元素强制转换为指定的类型。
16.生成操作符
生成操作符Range(),Empty(),Repeat()方法不是扩展方法,而是返回序列的正常静态方法。在LING to Object中,这些方法可用于Enumerable类。
Range()方法用来填充一个范围的数字。第一个参数作为起始值,第二个参数作为要填充的项数:
var values = Enumerable.Range(1,20);
结果为1至20的集合。
可以把该结果与其它扩展方法合并:
var values = Enumerable.Range(1,20).Select(n=> n*3);
Empty()方法返回一个不返回值的迭代器,它用于需要一个集合的参数,其中可以给参数传递空集合。
Repeat()方法返回指定个数的重复值的集合迭代器。