从LINQ开始之LINQ to Objects(下)
前言
上一篇《从LINQ开始之LINQ to Objects(上)》主要介绍了LINQ的体系结构、基本语法以及LINQ to Objects中标准查询操作符的使用方法。
本篇则主要讨论LINQ to Objects中的扩展方法以及延迟加载等方面的内容。
扩展方法
扩展方法简介
扩展方法能够向现有类型“添加”方法,而无需创建新的派生类型、重新编译或其他方式修改原始类型。扩展方法是静态方法,它是类的一部分,但实际没有放在类的源代码当中。
下面,我们来看一个简单示例,为上一篇中定义的Employee类添加扩展方法GetSeniority获取员工在本公司的工龄:
public static class EmployeeExtension
{
/// <summary>
/// 计算员工在本公司的工龄
/// </summary>
/// <param name="employee"></param>
/// <returns></returns>
public static long GetSeniority(this Employee employee)
{
TimeSpan ts = DateTime.Now - employee.EntryDate;
return (long)ts.TotalDays / 365;
}
}
接下来,遍历employees列表,输出所有员工的姓名及工龄:
//获取所有员工的姓名及在本公司的工龄
foreach (var employee in employees)
{
Console.WriteLine("EmployeeName: " + employee.EmployeeName + " Seniority: " + employee.GetSeniority());
}
//******************************Output*******************************
//EmployeeName: Mike Seniority: 1
//EmployeeName: Jack Seniority: 10
//EmployeeName: Adolph Seniority: 0
//EmployeeName: Antony Seniority: 6
//EmployeeName: Asa Seniority: 2
//EmployeeName: Bernie Seniority: 9
//EmployeeName: Carl Seniority: 2
//EmployeeName: Duncan Seniority: 7
//EmployeeName: Aimee Seniority: 0
//EmployeeName: Cassie Seniority: 3
//*******************************************************************
由示例可以看出:
1)扩展方法中,可以访问被扩展类型的所有公有方法和属性。
2)第一个参数是要扩展的类型,以this关键字开头。
3)即使扩展方法是静态的,也要使用标准的实例方法语法进行调用。
下面的示例演示了如果扩展方法与类中的某个方法具有相同的签名,则扩展方法不会被调用。在Employee类中定义方法SayHello
public void SayHello()
{
Console.WriteLine("Hello , I'm " + EmployeeName);
}
在EmployeeExtension类中为Employee类定义扩展方法SayHello
public static void SayHello(this Employee employee)
{
Console.WriteLine("Hello , I'm " + employee.EmployeeName + " ,this is Extension Method");
}
此时,新入职了一位同事Dave,调用SayHello方法向大家问好
Employee dave = new Employee("011", "Dave", 30, new DateTime(2017, 5, 25), Sex.Male, Department.PD, 200000, new string[] { "climbing" });
dave.SayHello();
//******************************Output*******************************
//Hello , I'm Dave
//*******************************************************************
注意:此时调用的是Employee类下面的SayHello方法。
使用扩展方法来扩展接口
把方法扩展到某个接口中,实现该接口的多个类就可以使用相同的实现代码。
以下示例介绍了扩展方法扩展接口的使用场景,首先,定义了一个接口IHobby,接口中包含Play方法
public interface IHobby
{
void Play();
}
分别创建类Reading、Swimming、Shopping实现IHobby接口
public class Reading : IHobby
{
public void Play()
{
Console.WriteLine("I'm Reading.");
}
}
public class Swimming : IHobby
{
public void Play()
{
Console.WriteLine("I'm Swimming.");
}
}
public class Shopping : IHobby
{
public void Play()
{
Console.WriteLine("I'm Shopping.");
}
}
此时,我们需要在实现IHobby接口的类增加一个的方法ShareFeelings,输出I'm happpy.当然,可以在接口上新增一个方法,然后将实现该接口的类逐个添加ShareFeelings方法,假如实现该接口的类很多,使用扩展方法,就可以大大的减少代码的修改量,测试起来也非常简单。
public static void ShareFeelings(this IHobby hobby)
{
Console.WriteLine("I'm happy.");
}
使用接口变量来调用扩展方法
IHobby hobby = new Reading();
hobby.ShareFeelings();
//******************************Output*******************************
//I'm happy.
//*******************************************************************
LINQ中的扩展方法
LINQ为IEnumerable<T>接口提供给了各种扩展方法,以便用户在实现了该接口的任意集合上使用LINQ查询。本节主要研究LINQ中Where扩展方法的实现,这个扩展方法位于System.Linq命名空间下的Enumerable类中。
public static IEnumerable<TSource> Where<TSource>(this IEnumerable<TSource> source, Func<TSource, bool> predicate) {
if (source == null) throw Error.ArgumentNull("source");
if (predicate == null) throw Error.ArgumentNull("predicate");
if (source is Iterator<TSource>) return ((Iterator<TSource>)source).Where(predicate);
if (source is TSource[]) return new WhereArrayIterator<TSource>((TSource[])source, predicate);
if (source is List<TSource>) return new WhereListIterator<TSource>((List<TSource>)source, predicate);
return new WhereEnumerableIterator<TSource>(source, predicate);
}
由上述代码可以看出,Where方法是对IEnumberable接口的扩展,需要传入一个委托参数predicate,该委托要求返回布尔类型。假设我们对List<T>类型的对象调用Where方法,则返回一个WhereListIterator<TSource>对象。WhereListIterator<TSource>类派生自Iterator<TSource>类,下面是Iterator<TSource>类的源码,这里我们只需要注意GetEnumerator方法,该方法对于同一个线程,返回同一个迭代器,不同线程则克隆一个,并将state属性设置为1。
abstract class Iterator<TSource> : IEnumerable<TSource>, IEnumerator<TSource>
{
int threadId;
internal int state;
internal TSource current;
public Iterator() {
threadId = Thread.CurrentThread.ManagedThreadId;
}
public TSource Current {
get { return current; }
}
public abstract Iterator<TSource> Clone();
public virtual void Dispose() {
current = default(TSource);
state = -1;
}
public IEnumerator<TSource> GetEnumerator() {
if (threadId == Thread.CurrentThread.ManagedThreadId && state == 0) {
state = 1;
return this;
}
Iterator<TSource> duplicate = Clone();
duplicate.state = 1;
return duplicate;
}
public abstract bool MoveNext();
public abstract IEnumerable<TResult> Select<TResult>(Func<TSource, TResult> selector);
public abstract IEnumerable<TSource> Where(Func<TSource, bool> predicate);
object IEnumerator.Current {
get { return Current; }
}
IEnumerator IEnumerable.GetEnumerator() {
return GetEnumerator();
}
void IEnumerator.Reset() {
throw new NotImplementedException();
}
}
此时,再回到WhereListIterator<TSource>类,该类重写了MoveNext方法。首先,调用GetEnumerator方法获得一个枚举器,在While循环中,只要MoveNext方法返回true,就用Current属性获得集合当前的元素,并使用委托predicate引用的方法处理该元素,返回剩余元素中满足条件的第一个元素。当遍历结束,调用Dispose方法释放非托管资源,并将state属性设置为-1。
class WhereListIterator<TSource> : Iterator<TSource>
{
List<TSource> source;
Func<TSource, bool> predicate;
List<TSource>.Enumerator enumerator;
public WhereListIterator(List<TSource> source, Func<TSource, bool> predicate) {
this.source = source;
this.predicate = predicate;
}
public override Iterator<TSource> Clone() {
return new WhereListIterator<TSource>(source, predicate);
}
public override bool MoveNext() {
switch (state) {
case 1:
enumerator = source.GetEnumerator();
state = 2;
goto case 2;
case 2:
while (enumerator.MoveNext()) {
TSource item = enumerator.Current;
if (predicate(item)) {
current = item;
return true;
}
}
Dispose();
break;
}
return false;
}
public override IEnumerable<TResult> Select<TResult>(Func<TSource, TResult> selector) {
return new WhereSelectListIterator<TSource, TResult>(source, predicate, selector);
}
public override IEnumerable<TSource> Where(Func<TSource, bool> predicate) {
return new WhereListIterator<TSource>(source, CombinePredicates(this.predicate, predicate));
}
}
源码传送门:http://referencesource.microsoft.com/#System.Core/System/Linq/Enumerable.cs,dc4c4c53ff606bc0
延迟加载
延迟执行
在运行期间定义查询表达式时,查询不会运行,只有在迭代时才进行计算。
下面的示例定义了一个LINQ查询,从集合中找出姓名以A开头的所有员工,因为迭代在查询定义时不会进行,而是在执行每个foreach语句时进行。
var nameStartWithA = from e in employees
where e.EmployeeName.StartsWith("A")
select e;
Console.WriteLine("First iteration : ");
foreach (var item in nameStartWithA)
{
Console.WriteLine(item.EmployeeName);
}
Console.WriteLine();
employees.Add(new Employee("011", "Lily", 25, new DateTime(2017, 5, 29), Sex.Female, Department.HR, 100000, new string[] { "shopping" }));
employees.Add(new Employee("012", "Leo", 28, new DateTime(2017, 5, 29), Sex.Male, Department.IT, 200000, new string[] { "reading" }));
employees.Add(new Employee("013", "Amelia", 29, new DateTime(2017, 5, 29), Sex.Female, Department.PD, 200000, new string[] { "reading", "run" }));
employees.Add(new Employee("014", "Ava", 32, new DateTime(2017, 5, 29), Sex.Female, Department.PD, 400000, new string[] { "swimming" }));
Console.WriteLine("Second iteration : ");
foreach (var item in nameStartWithA)
{
Console.WriteLine(item.EmployeeName);
}
//******************************Output*******************************
//First iteration :
//Adolph
//Antony
//Asa
//Aimee
//Second iteration :
//Adolph
//Antony
//Asa
//Aimee
//Amelia
//Ava
//*******************************************************************
补充:延迟加载的工作原理可从上一章节中对源码的分析得出。
立即执行
查询在定义表达式时立即执行,而不是在迭代中进行。通过调用ToArray()、ToList()等扩展方法可以实现此项操作。
下面,我们修改上一节中的示例来说明:
var nameStartWithA = (from e in employees
where e.EmployeeName.StartsWith("A")
select e).ToList();
Console.WriteLine("First iteration : ");
foreach (var item in nameStartWithA)
{
Console.WriteLine(item.EmployeeName);
}
Console.WriteLine();
employees.Add(new Employee("011", "Lily", 25, new DateTime(2017, 5, 29), Sex.Female, Department.HR, 100000, new string[] { "shopping" }));
employees.Add(new Employee("012", "Leo", 28, new DateTime(2017, 5, 29), Sex.Male, Department.IT, 200000, new string[] { "reading" }));
employees.Add(new Employee("013", "Amelia", 29, new DateTime(2017, 5, 29), Sex.Female, Department.PD, 200000, new string[] { "reading", "run" }));
employees.Add(new Employee("014", "Ava", 32, new DateTime(2017, 5, 29), Sex.Female, Department.PD, 400000, new string[] { "swimming" }));
Console.WriteLine("Second iteration : ");
foreach (var item in nameStartWithA)
{
Console.WriteLine(item.EmployeeName);
}
//******************************Output*******************************
//First iteration :
//Adolph
//Antony
//Asa
//Aimee
//Second iteration :
//Adolph
//Antony
//Asa
//Aimee
//*******************************************************************
从输出结果中可以看出,两次迭代输出的结果相同,但是集合中值改变了。
示例代码下载:https://github.com/Answer-Geng/LINQ