委托发展史(Linq操作符)

嗯~这篇就讲讲Linq吧!

之前讲过Lambda最后进化到了令人发指的地步:

Func<string, int> returnLength;
returnLength = text => text.Length;

Console.WriteLine(returnLength("Hellow"));

来,把这个lambda表达式拿出来(text => text.Length),好眼熟啊,好像在某个地方用到过。

*LINQ

这个东西直到现在都是我见过的最好的表达式,他虽然不是银弹,但却是你开发"兵器库"中一个非常强大的兵器。

Linq有两种写法,这篇来讲操作符。先说说组成哈。

IEnumerable.linq操作符 (委托,方法,Lambda);

例如:

list<int>.Select(x => x + 1);

Select:循环集合 条件是 集合里的每一个int + 1;

来说说linq是怎么组成的吧。

算了,直接看linq的源代码吧。Select的哈

public static IEnumerable<TResult> Select<TSource, TResult>(this IEnumerable<TSource> source, Func<TSource, TResult> selector)

静态方法有this说明是一个扩展方法,this在IEnumerable前,一个IEnumerable<TResult>的扩展方法,参数是一个Func<TSource, TResult>的泛型委托。

由于参数是委托,所以linq的括号里可放入,符合条件的方法,一个类似的委托,或者Lambda表达式。

其中我们最常用的就是Lambda表达式。因为是委托的终极进化,最简便的一个了。

linq有一个延迟加载的特性,最初我以为是委托的原因(因为委托就是只有在执行Invoke的时候才执行),后来去网上查询资料。

发现延迟加载完全拜一个 yield return 所实现的。

来看一看这个诡异的东西吧。。。

public IEnumerable<int> OutValue(List<int> list)
{
     foreach (var a in list)
     {
        Console.WriteLine(a);
        yield return a;
     }
}

这是一个yield return返回IEnumerable的方法,内容很简单就是输出一下集合里的值,然后yield return了。

然后我调用它的时候奇怪了。

test.OutValue(list);

输出:

嗯~,换一个思路试一下,既然你不输出啥,那我再循环一次看看吧!

var val = OutValue(list);

foreach (var a in val){}

我没有加任何操作,只是单纯的循环了一下。输出结果却是:

哼哼,显而易见了。延迟加载拜这个yield 所致啊。

如果我们要简单的实现一个Select的话,很简单:

  public static IEnumerable<TResult> Select<TSource,TResult>(this IEnumerable<TSource> source,Func<TSource,TResult> selector)
  {
      foreach (TSource element in source)
         yield return selector(element);
  }

粗暴明了,当然源代码不是这样的。。。但意思差不多。foreach循环这个集合,yield return 执行这个selector 委托,委托实例是什么?就是你穿的Lambda,方法,委托啦~当然必须是满足条件的。

yield 语句只能出现在 iterator 块中,该块可用作方法、运算符或访问器的体。

当用到Select返回的值时,yield return 会去执行这个Func委托。这就是延迟加载的原理吗?(请各位大佬指正,小弟可能讲的不正确,欢迎指正哈。)

看看别的操作符是怎么实现的

*Max最大值

[__DynamicallyInvokable]
public static int Max(this IEnumerable<int> source)
{
    if (source == null)
    {
        throw Error.ArgumentNull("source");
    }
    int num = 0;
    bool flag = false;
    foreach (int current in source)
    {
        if (flag)
        {
            if (current > num)
            {
                num = current;
            }
        }
        else
        {
            num = current;
            flag = true;
        }
    }
    if (flag)
    {
        return num;
    }
    throw Error.NoElements();
}

Max只支持对int集合的扩展,内部是不是非常简单,就是生命一个int变量存最大值,一个bool类型来判断是否执行了这个foreach循环。

来看看经常用的排序吧!

*Groupby

[__DynamicallyInvokable]
public static IEnumerable<IGrouping<TKey, TSource>> GroupBy<TSource, TKey>(this IEnumerable<TSource> source, Func<TSource, TKey> keySelector)
{
    return new GroupedEnumerable<TSource, TKey, TSource>(source, keySelector, IdentityFunction<TSource>.Instance, null);
}

但最后执行的原理在这里。。。

[__DynamicallyInvokable, IteratorStateMachine(typeof(Lookup<, >.<GetEnumerator>d__12))]
public IEnumerator<IGrouping<TKey, TElement>> GetEnumerator()
{
    Lookup<TKey, TElement>.Grouping next = this.lastGrouping;
    if (next != null)
    {
        do
        {
            next = next.next;
            yield return next;
        }
        while (next != this.lastGrouping);
    }
    yield break;
}
Lookup<Tkey,TValue>是.NET3.5中新增的,它类似与Dictionary<Tkey,TElement>,但把键映射带一个值集上.这个类在程序及System.Core中实现,用System,Linq命名空间定义.
Grouping是最终实现排序的那个程序。取最后一个,判断非空,然后进行do{}while()循环。也是用了yield return延迟加载。

  *Where

where里的委托与select是不一样的;
public static IEnumerable<TSource> Where<TSource>(this IEnumerable<TSource> source, Func<TSource, bool> predicate)
Where委托的返回值时bool类型,但扩展方法又要返回IEnumerable<TSource>类型的。
大体上的意思就是这样的:
public static IEnumerable<TSource> Where<TSource>(this IEnumerable<TSource> source, Func<TSource, bool> predicate)
{
    foreach (TSource element in source)
    {
       if (predicate(element))
       {
          yield return element;
       }
    }
}

大致上是这样的,我理解的是.当然源代码不是这样的。当委托Func为true时才会yield return。也是有延迟加载的特性的。。。

等等等。。。太多了就不一一列举了。

那么会有人问了,我不想用这个延迟加载怎么办,我就想跟foreach循环一样,我就想立即加载。

肯定是可以的,有要求肯定是会满足的。

很简单,将返回值转换为另外一种类型即可,Linq的查询操作符中包含了转换操作的定义:ToArray(转换为数组)、ToDictionary(转换为字典)、ToList(转换为集合),使用这些转换运算就可以将延迟执行转换为立即执行,也就可以避免延迟执行了。

*总结

就写这么多吧。毕竟我的理解也是有限的,还请各位大佬们指正。

有错误的地方欢迎各位大佬指出来,我会努力进步,努力改正的。

 给大家几段比较简单的linq的源码。

SelectMany的源码:将序列的每个元素投影到 IEnumerable(T) 并将结果序列合并为一个序列。

[IteratorStateMachine(typeof(Enumerable.<SelectManyIterator>d__17<, >))]
private static IEnumerable<TResult> SelectManyIterator<TSource, TResult>(IEnumerable<TSource> source, Func<TSource, IEnumerable<TResult>> selector)
{
    foreach (TSource current in source)
    {
        foreach (TResult current2 in selector(current))
        {
            yield return current2;
        }
        IEnumerator<TResult> enumerator2 = null;
    }
    IEnumerator<TSource> enumerator = null;
    yield break;
}

简单的说一下下他的应用吧。看源代码应该能看出它是两个foreach,算了不说了直接上代码。

//班级类
public class Class
{
    public List<Student> stuList { get; set; }  
}
//学生类
public class Student
{
    public string Name { get; set; }
    public string Sex { get; set; }
}

static void Main(string[] args)
{
     List<Class> list = new List<Class>();
     //Select
     List<List<Student>> result = list.Select(m => m.stuList).ToList();
     //SelectMany
     List<Student>       result = list.SelectMany(m => m.stuList).ToList();  
}

 Sum的源码:int集合求和

[__DynamicallyInvokable]
public static int Sum(this IEnumerable<int> source)
{
    if (source == null)
    {
        throw Error.ArgumentNull("source");
    }
    int num = 0;
    checked
    {
        foreach (int current in source)
        {
            num += current;
        }
        return num;
    }
}

All的源码:All表示集合中的所有元素满足表达式条件,即返回true。

[__DynamicallyInvokable]
public static bool All<TSource>(this IEnumerable<TSource> source, Func<TSource, bool> predicate)
{
    if (source == null)
    {
        throw Error.ArgumentNull("source");
    }
    if (predicate == null)
    {
        throw Error.ArgumentNull("predicate");
    }
    foreach (TSource current in source)
    {
        if (!predicate(current))
        {
            return false;
        }
    }
    return true;
}

多谢观看!

posted @ 2018-05-09 11:45  捕头的爱  阅读(411)  评论(0编辑  收藏  举报