Lambda表达式和表达式树 - 山涧清泉

在C# 2.0中，通过方法组转换和匿名方法，使委托的实现得到了极大的简化。但是，匿名方法仍然有些臃肿，而且当代码中充满了匿名方法的时候，可读性可能就会受到影响。C# 3.0中出现的Lambda表达式在不牺牲可读性的前提下，进一步简化了委托。

LINQ的基本功能就是创建操作管道，以及这些操作需要的任何状态。这些操作表示了各种关于数据的逻辑，例如数据筛选，数据排序等等。通常这些操作都是用委托来表示。Lambda表达式是对LINQ数据操作的一种符合语言习惯的表示方式。

Lambda表达式不仅可以用来创建委托实例，C#编译器也能够将他们转换成表达式树。

下面我们就先看看Lambda表达式。

作为委托的Lambda表达式

Lambda表达式可以看作是C# 2.0的匿名方法的进一步演变，所以匿名方法能做的几乎一切事情都可以用Lambda表达式来完成（注意，匿名方法可以忽略参数，Lambda表达式不具备这个特性）。

跟匿名方法类似，Lambda表达式有特殊的转换规则：表达式的类型本身并非委托类型，但它可以通过隐式或显式的发那个是转换为一个委托实例。匿名函数这个术语同时涵盖了匿名方法和Lambda表达式。

下面看看使用Lambda表达式获得字符串长度的例子，通过Lambda将得到更见简洁、易读的代码：

static void Main(string[] args)
{
    //使用C# 2.0中的匿名方法获取字符串长度
    Func<string, int> strLength = delegate(string str) { return str.Length; };
    Console.WriteLine(strLength("Hello World!"));

    //使用Lambda表达式
    //（显式类型参数列表）=> {语句}，lambda表达式最冗长版本
    strLength = (string str) => { return str.Length; };
    Console.WriteLine(strLength("Hello World!"));

    //单一表达式作为主体
    //（显式类型参数列表）=> 表达式
    strLength = (string str) => str.Length;
    Console.WriteLine(strLength("Hello World!"));

    //隐式类型的参数列表
    //（隐式类型参数列表）=> 表达式
    strLength = (str) => str.Length;
    Console.WriteLine(strLength("Hello World!"));

    //单一参数的快捷语法
    //参数名 => 表达式
    strLength = str => str.Length;
    Console.WriteLine(strLength("Hello World!"));
}

"=>"是C# 3.0新增的，告诉编译器我们正在使用Lambda表达式。"=>"可以读作"goes to"，所以例子中的Lambda表达式可以读作"str goes to str.Length"。从例子中还可以看到，根据Lambda使用的特殊情况，我们可以进一步简化Lambda表达式。

Lambda表达式大多数时候都是和一个返回非void的委托类型配合使用（例如Func<TResult>）。在C# 1.0中，委托一般用于事件，很少会返回什么结果。在LINQ中，委托通常被视为数据管道的一部分，接受输入并返回结果，或者判断某项是否符合当前的筛选器等等。

Lambda表达式本质

通过ILSpy查看上面的例子，可以发现Lambda表达式就是匿名方法，是编译器帮我们进行了转换工作，使我们可以直接使用Lambda表达式来进一步简化创建委托实例的代码。

在List<T>中使用Lambda表达式

前面简单的介绍了什么是Lambda表达式，下面通过一个例子进一步了解Lambda表达式。

在前面的文章中，我们也提到了一下List<T>的方法，例如FindAll方法，参数是Predicate<T>类型的委托，返回结果是一个筛选后的新列表；Foreach方法获取一个Action<T>类型的委托，然后对每个元素设置行为。下面就看看在List<T>中使用Lambda表达式：

public class Book
{
    public string Name { get; set; }
    public int Year { get; set; }
}

class Program
{
    static void Main(string[] args)
    {
        var books = new List<Book>
        {
            new Book{Name="C# learning guide",Year=2005},
            new Book{Name="C# step by step",Year=2005},
            new Book{Name="Java learning guide",Year=2004},
            new Book{Name="Java step by step",Year=2004},
            new Book{Name="Python learning guide",Year=2003},
            new Book{Name="C# in depth",Year=2012},
            new Book{Name="Java in depth",Year=2014},
            new Book{Name="Python in depth",Year=2013},
        };

        //创建一个委托实例来表示一个通用的操作
        Action<Book> printer = book => Console.WriteLine("Name = {0}, Year = {1}", book.Name, book.Year);

        books.ForEach(printer);

        //使用Lambda表达式对List<T>进行筛选
        books.FindAll(book => book.Year > 2010).ForEach(printer);

        books.FindAll(book => book.Name.Contains("C#")).ForEach(printer);

        //使用Lambda表达式对List<T>进行排序
        books.Sort((book1, book2) => book1.Name.CompareTo(book2.Name));
        books.ForEach(printer);

        Console.Read();
    }
}

从上面例子可以看到，当我们要经常使用一个操作的时候，我们最好创建一个委托实例，然后反复调用，而不是每次使用的时候都使用Lambda表达式（例如例子中的printer委托实例）。

相比C# 1.0中的委托或者C# 2.0的匿名函数，结合Lambda表达式，对List<T>中的数据操作变得简单，易读。

表达式树

表达式树也称表达式目录树，将代码以一种抽象的方式表示成一个对象树，树中每个节点本身都是一个表达式。表达式树不是可执行代码，它是一种数据结构。

下面我们看看怎么通过C#代码建立一个表达式树。

构建表达式树

System.Linq.Expressions命名空间中包含了代表表达式的各个类，所有类都从Expression派生，我们可以通过这些类中的静态方法来创建表达式类的实例。Expression类包括两个重要属性：

Type属性代表求值表达式的.NET类型，可以把它视为一个返回类型
NodeType属性返回所代表的表达式的类型

下面看一个构建表达式树的简单例子：

Expression numA = Expression.Constant(6);
Console.WriteLine("NodeType: {0}, Type: {1}", numA.NodeType, numA.Type);
Expression numB = Expression.Constant(3);
Console.WriteLine("NodeType: {0}, Type: {1}", numB.NodeType, numB.Type);

BinaryExpression add = Expression.Add(numA, numB);
Console.WriteLine("NodeType: {0}, Type: {1}", add.NodeType, add.Type);

Console.WriteLine(add);
Console.Read();

代码的输出为：

通过例子可以看到，我们构建了一个(6+3)的表达式树，并且查看了各个节点的Type和NodeType属性。

Expression有很多派生类，有很多节点类型。例如，BinaryExpression就代表了具有两个操作树的任意操作。这正是NodeType属性重要的地方，它能区分由相同的类表示的不同种类的表达式。其他的节点类型就不介绍了，有兴趣可以参考MSDN。

对于上面的例子，可以用下图描述生成的表达式树，值得注意的是，"叶子"表达式在代码中是最先创建的，，表达式是自下而上构建的。表达式是不易变的，所有可以缓存和重用表达式。

将表达式编译成委托

LambdaExpression是从Expression派生的类型之一。泛型类型Expression<TDelegate>又是从LambdaExpress派生的。

Expression和Expression<TDelegate>的区别在于，泛型类以静态类型的方式标志了它是什么种类的表达式，也就是说，它确定了返回类型和参数。例如上面的加法例子，返回值是一个int类型，没有参数，所以我们可以使用签名Func<int>与之匹配，所以可以用Expression<Func<int>>以静态类型的方式来表示该表达式。

这样做的目的在于，LambdaExpression有一个Compile方法，该方法能创建一个恰当类型的委托。Expression<TDelegate>也有一个同名方法，该方法可以返回TDelegate类型的委托。获得了委托之后，我们就可以使用普通委托实例调用的方式来执行这个表达式。

接着上面加法的例子，我们把上面的加法表达式树转换成委托，然后执行委托：

Func<int> addDelegate = Expression.Lambda<Func<int>>(add).Compile();
Console.WriteLine(addDelegate());

从这个例子中我们看到怎么构建一个表达式树，然后把这个对象树编译成真正的代码。在.NET 3.5中的表达式树只能是单一的表达式，不能表示完整的类、方法。这在.NET 4.0中得到了一定的改进，表达式树可以支持动态类型，我们可以创建块，为表达式赋值等等。

将Lambda表达式转换为表达式树

Lambda表达式不仅可以创建委托实例，C# 3.0对于将Lambda表达式转换成表达式树提供了内建的支持。我们可以通过编译器把Lambda表达式转换成一个表达式树，并创建一个Expression<TDelegate>的一个实例。

下面的例子中我们将一个Lambda表达式转换成一个表达式树，并通过代码查看表达式树的各个部分：

static void Main(string[] args)
{
    //将Lambda表达式转换为类型Expression<T>的表达式树
    //expression不是可执行代码
    Expression<Func<int, int, int>> expression = (a, b) => a + b;

    Console.WriteLine(expression);
    //获取Lambda表达式的主体
    BinaryExpression body = (BinaryExpression)expression.Body;
    Console.WriteLine(expression.Body);
    //获取Lambda表达式的参数
    Console.WriteLine(" param1: {0}, param2: {1}", expression.Parameters[0], expression.Parameters[1]);
    ParameterExpression left = (ParameterExpression)body.Left;
    ParameterExpression right = (ParameterExpression)body.Right;
    Console.WriteLine(" left body of expression: {0}{4} NodeType: {1}{4} right body of expression: {2}{4} Type: {3}{4}", left.Name, body.NodeType, right.Name, body.Type, Environment.NewLine);

    //将表达式树转换成委托并执行
    Func<int, int, int> addDelegate = expression.Compile();
    Console.WriteLine(addDelegate(10, 16));
    Console.Read();
}

代码的输出为：

表达式树的用途

前面看到，通过Expression的派生类中的各种节点类型，我们可以构建表达式树；然后可以把表达式树转换成相应的委托类型实例，最后执行委托实例的代码。但是，我们不会绕这么大的弯子来执行委托实例的代码。

表达式树主要在LINQ to SQL中使用，我们需要将LINQ to SQL查询表达式（返回IQueryable类型）转换成表达式树。之所以需要转换是因为LINQ to SQL查询表达式不是在C#代码中执行的，LINQ to SQL查询表达式被转换成SQL，通过网络发送，最后在数据库服务器上执行。

这里只做个简单的介绍，后续会介绍LINQ to SQL相关的内容。

编译器对Lambda表达式的处理

前面我们了解到，Lambda可以用来创建委托实例，也可以用来生成表达式树，这些都是编译器帮我们完成的。

编译器如何决定生成可执行的IL还是一个表达式树：

当Lambda表达式赋予一个委托类型的变量时，编译器生成与匿名方法同样的IL（可执行的委托实例）
当Lambda表达式赋予一个Expression类型的变量时，编译器就将它转换成一个表达式树

下图展示了LINQ to Object和LINQ to SQL中Lambda表达式的不同处理方式：

总结

本文中介绍了Lambda表达式，在匿名方法的基础上进一步简化了委托实例的创建，编写更加简洁、易读的代码。匿名函数不等于匿名方法，匿名函数包含了匿名方法和lambda表达式这两种概念

Lambda不仅可以创建委托实例，还可以由编译器转换成表达式树，使代码可以在程序之外执行（参考LINQ to SQL）。

发表于 2017-12-06 11:06 山涧清泉阅读(243) 评论(0) 收藏举报