C#中的Lambda总结
Lambda的前世今生
早在C# 1.0 时,C#中就引入了委托(delegate)类型的概念。通过使用这个类型,我们可以将函数作为参数进行传递。在某种意义上,委托可理解为一种托管的强类型的函数指针。
通常情况下,使用委托来传递函数需要一定的步骤:
- 定义一个委托,包含指定的参数类型和返回值类型。
- 在需要接收函数参数的方法中,使用该委托类型定义方法的参数签名。
- 为指定的被传递的函数创建一个委托实例。
可能这听起来有些复杂,不过本质上说确实是这样。上面的第 3 步通常不是必须的,C# 编译器能够完成这个步骤,但步骤 1 和 2 仍然是必须的。
//自定义四个委托
public delegate void NonReturnNonParam(); //不带参数没有返回值
public delegate int WithReturnNonParam(); //不带参数有返回值
public delegate void NonReturnWithParam(int count); //带参数没有返回值
public delegate string WithReturnWithParam(int count, string name); //带参数有返回值
可以看出,委托和一般的方法比较类似,形式区别在于加了个delegate关键字,和没有方法体以分号结束
//符合WithReturnWithParam的约束
public static string TestWithReturnWithParam(int count, string name)
{
return name+count.ToString();
}
WithReturnWithParam deleg1 = new WithReturnWithParam(TestWithReturnWithParam);
int getReturn =deleg1.Invoke(10, "wakw");
//或者
int getReturn = deleg1(10,"wakw");
那么,如果我只是想执行一些代码该怎么办(或者一些不需要其他调用,就委托调用,这样没必要再单独写个方法)?
在 C# 2.0 中提供了一种方式,创建匿名函数。
WithReturnWithParam deleg1 = delegate(int c,string n)
{
return n+c.ToString();
};
//这个就把方法和委托的声明整到一起了
在C# 2.0中,通过方法组转换和匿名方法,使委托的实现得到了极大的简化。但是,匿名方法仍然有些臃肿,而且当代码中充满了匿名方法的时候,可读性可能就会受到影响,这种语法并没有流行起来。C# 3.0中出现的Lambda表达式在不牺牲可读性的前提下,进一步简化了委托。
为了改进这些语法,在 .NET 3.5 框架和 C# 3.0 中引入了Lambda 表达式。
Lambda表达式
首先我们先了解下 Lambda 表达式名字的由来。实际上这个名字来自微积分数学中的 λ,其涵义是声明为了表达一个函数具体需要什么。更确切的说,它描述了一个数学逻辑系统,通过变量结合和替换来表达计算。所以,基本上我们有 0-n 个输入参数和一个返回值。而在编程语言中,我们也提供了无返回值的 void 支持。
Lambda表达式可以看作是C# 2.0的匿名方法的进一步演变,所以匿名方法能做的几乎一切事情都可以用Lambda表达式来完成(注意,匿名方法可以忽略参数,Lambda表达式不具备这个特性)。
//演变
WithReturnWithParam deleg1 = new WithReturnWithParam(TestWithReturnWithParam);
//采用匿名方法
WithReturnWithParam deleg2 =new WithReturnWithParam(delegate(int c, string n)
{
return n + c.ToString();
});
//把关键字delegate去掉 换成括号后面的=>
WithReturnWithParam deleg4 =new WithReturnWithParam((int c, string n) =>
{
return n + c.ToString();
});
//进一步吧参数类型去掉(因为约束是内定的)
WithReturnWithParam deleg5 = new WithReturnWithParam((c, n) =>
{
return n + c.ToString();
});
//可以省略掉new WithReturnWithParam
WithReturnWithParam deleg3 = delegate(int c, string n)
{
return n + c.ToString();
};
WithReturnWithParam deleg6 = (int c, string n) =>
{
return n + c.ToString();
};
WithReturnWithParam deleg7 = (c, n) =>
{
return n + c.ToString();
};
//对于后面如果执行一句可以省括号,这时对于有返回值的可以省略和return
WithReturnWithParam deleg8 = (c, n) =>n + c.ToString();
//如果仅有一个参数,还可以省略掉小括号
NonReturnWithParam deleg9=m=>{};
//其他形式
WithReturnNonParam deleg10 = ()=> "唔拉拉";
NoneReturnNonParam deleg11 = ()=> {};
//以上都是正确的
Lambda表达式本质就是匿名方法,是编译器帮我们进行了转换工作,使我们可以直接使用Lambda表达式来进一步简化创建委托实例的代码。
在 C# 2.0 中引入了泛型。现在我们能够编写泛型类、泛型方法和最重要的:泛型委托。如下:
public delegate void WithReturnWithTParam<T>(T param,int s,string add);
WithReturnWithTParam<WithReturnWithParam> deleg11 = (d,i,s) => d.Invoke(i, s);
string getStr=deleg11.Invoke(deleg8, 4);
尽管如此,直到 .NET 3.5,微软才意识到实际上仅通过两种泛型委托就可以满足 99% 的需求,所以基本上不用自定位委托了
- Action:无输入参数,无返回值
- Action<T1, ..., T16>:支持1-16个输入参数,无返回值
- Func<T1, ..., T16, Tout>:支持1-16个输入参数,有返回值
Action 委托返回 void 类型,Func 委托返回指定类型的值。通过使用这两种委托,在绝大多数情况下,上述的步骤 1 可以省略了。但是步骤 2 仍然是必需的,但仅是需要使用 Action 和 Func。
Action a1=()=>{}; //无参数不返回
Action<int> a2=(s)=>{}; //带参数不返回
Action<int,T> a2=(s,t)=>{}; //带参数不返回
Func<string> b1=()=>""; //无参数带返回值 最后一个是参数返回类型,即string
Func<T,string> b1=(d,c)=>""; //带参数带返回string类型的值
这些自定义委托可以用系统定义的泛型委托Action和Func实现
//自定义四个委托
public delegate void NonReturnNonParam(); //不带参数没有返回值
public delegate int WithReturnNonParam(); //不带参数有返回值
public delegate void NonReturnWithParam(int count); //带参数没有返回值
public delegate string WithReturnWithParam(int count, string name); //带参数有返回值
NonReturnNonParam a1=()=>{};
Action a1=()=>{};
NonReturnWithParam a2=(s)=>{};
Action<int> a1=(s)=>{};
WithReturnNonParam b1=()=>2;
Func<int> b1=()=>2;
WithReturnWithParam b2=(d,q)=q;
Func<int,string,string> b1=(d,q)=>q;
Lambda表达式的示例
让我们来看一些 Lambda 表达式的示例:
Action dummyLambda = () =>
{
Console.WriteLine("Hello World from a Lambda expression!");
};
Action<double, double> printProduct = (x, y) => { Console.WriteLine(x * y); };
Func<double, double> square = x => x * x;
Func<double, double, double> product = (x, y) => x * y;
//大多数情况下,var 声明可能无法使用,会报错,仅在一些特殊的情况下可以使用。
var square=(double x)=>x*x; //报错
var a = 5;
Func<int, int> multiplyWith = x => x * a;
var result1 = multiplyWith(10); // 50
a = 10;
var result2 = multiplyWith(10); // 100
//可以看到,在 Lambda 表达式中可以使用外围的变量,也就是闭包。
static void DoSomeStuff()
{
var coeff = 10;
Func<int, int> compute = x => coeff * x;
Action modifier = () =>
{
coeff = 5;
};
var result1 = DoMoreStuff(compute); // 50
ModifyStuff(modifier);
var result2 = DoMoreStuff(compute); // 25
}
static int DoMoreStuff(Func<int, int> computer)
{
return computer(5);
}
static void ModifyStuff(Action modifier)
{
modifier();
}
第二个 Lambda 表达式展示了在 Lambda 表达式中能够修改外围变量的能力。这就意味着通过在函数间传递 Lambda 表达式,我们能够在其他方法中修改其他作用域中的局部变量。因此,我认为闭包是一种特别强大的功能,但有时也可能引入一些非期望的结果。
var buttons = new Button[10];
for (var i = 0; i < buttons.Length; i++)
{
var button = new Button();
button.Text = (i + 1) + ". Button - Click for Index!";
button.OnClick += (s, e) => { Messagebox.Show(i.ToString()); };
buttons[i] = button;
}
//What happens if we click ANY button?! 答案是:所有的 Button 都显示 10!
//因为随着 for 循环的遍历,局部变量 i 的值已经被更改为 buttons 的长度 10。一个简单的解决办法类似于:
var button = new Button();
var index = i;
button.Text = (i + 1) + ". Button - Click for Index!";
button.OnClick += (s, e) => { Messagebox.Show(index.ToString()); };
buttons[i] = button;
List<T>的方法,例如FindAll方法,参数是Predicate<<T>类型的 委托,返回结果是一个筛选后的新列表;Foreach方法获取一个Action<T>类型的委托,然后对每个元素设置行为。下面就看看在 List<T>中使用Lambda表达式
public class Book
{
public string Name { get; set; }
public int Year { get; set; }
}
class Program
{
static void Main(string[] args)
{
var books = new List<Book>
{
new Book{Name="C# learning guide",Year=2005},
new Book{Name="C# step by step",Year=2005},
new Book{Name="Java learning guide",Year=2004},
new Book{Name="Java step by step",Year=2004},
new Book{Name="Python learning guide",Year=2003},
new Book{Name="C# in depth",Year=2012},
new Book{Name="Java in depth",Year=2014},
new Book{Name="Python in depth",Year=2013},
};
//创建一个委托实例来表示一个通用的操作
Action<Book> printer = book => Console.WriteLine("Name = {0}, Year = {1}", book.Name, book.Year);
books.ForEach(printer);
//使用Lambda表达式对List<T>进行筛选
books.FindAll(book => book.Year > 2010).ForEach(printer);
books.FindAll(book => book.Name.Contains("C#")).ForEach(printer);
//使用Lambda表达式对List<T>进行排序
books.Sort((book1, book2) => book1.Name.CompareTo(book2.Name));
books.ForEach(printer);
Console.Read();
}
}
从上面例子可以看到,当我们要经常使用一个操作的时候,我们最好创建一个委托实例,然后反复调用,而不是每次使用的时候都使用Lambda表达式
到此为止,我们可以看到 Lambda可以用来创建委托实例,除此以外,还可以由编译器转换成表达式树,使代码可以在程序之外执行
表达式树
表达式树也称表达式目录树,将代码以一种抽象的方式表示成一个对象树,树中每个节点本身都是一个表达式。表达式树不是可执行代码,它是一种数据结构。
System.Linq.Expressions命名空间中包含了代表表达式的各个类,所有类都从Expression派生,我们可以通过这些类中的静态方法来创建表达式类的实例。Expression类包括两个重要属性:
- Type属性代表求值表达式的.NET类型,可以把它视为一个返回类型
- NodeType属性返回所代表的表达式的类型
下面看一个构建表达式树的简单例子
Expression numA = Expression.Constant(6);
Console.WriteLine("NodeType: {0}, Type: {1}", numA.NodeType, numA.Type);
Expression numB = Expression.Constant(3);
Console.WriteLine("NodeType: {0}, Type: {1}", numB.NodeType, numB.Type);
BinaryExpression add = Expression.Add(numA, numB);
Console.WriteLine("NodeType: {0}, Type: {1}", add.NodeType, add.Type);
Console.WriteLine(add);
Console.Read();
通过例子可以看到,我们构建了一个(6+3)的表达式树,并且查看了各个节点的Type和NodeType属性。
Expression有很多派生类,有很多节点类型。例如,BinaryExpression就代表了具有两个操作树的任意操作。这正是NodeType属性重要的地方,它能区分由相同的类表示的不同种类的表达式。其他的节点类型就不介绍了,有兴趣可以参考MSDN。
将表达式编译成委托
LambdaExpression是从Expression派生的类型之一。泛型类型Expression<TDelegate>又是从LambdaExpress派生的。
Expression和Expression<TDelegate>的区别在于,泛型类以静态类型的方式标志了它是什么种类的表达式,也就是说,它确定了返回类型和参数。例如上面的加法例子,返回值是一个int类型,没有参数,所以我们可以使用签名Func<int>与之匹配,所以可以用Expression<Func<int>>以静态类型的方式来表示该表达式。
这样做的目的在于,LambdaExpression有一个Compile方法,该方法能创建一个恰当类型的委托。 Expression<TDelegate>也有一个同名方法,该方法可以返回TDelegate类型的委托。获得了委托之后,我们就可以使 用普通委托实例调用的方式来执行这个表达式。
接着上面加法的例子,我们把上面的加法表达式树转换成委托,然后执行委托:
Func<int> addDelegate = Expression.Lambda<Func<int>>(add).Compile();
Console.WriteLine(addDelegate());
从这个例子中我们看到怎么构建一个表达式树,然后把这个对象树编译成真正的代码。在.NET 3.5中的表达式树只能是单一的表达式,不能表示完整的类、方法。这在.NET 4.0中得到了一定的改进,表达式树可以支持动态类型,我们可以创建块,为表达式赋值等等。
将Lambda表达式转换为表达式树
Lambda表达式不仅可以创建委托实例,C# 3.0对于将Lambda表达式转换成表达式树提供了内建的支持。我们可以通过编译器把Lambda表达式转换成一个表达式树,并创建一个Expression<TDelegate>的一个实例。
下面的例子中我们将一个Lambda表达式转换成一个表达式树,并通过代码查看表达式树的各个部分:
static void Main(string[] args)
{
//将Lambda表达式转换为类型Expression<T>的表达式树
//expression不是可执行代码
Expression<Func<int, int, int>> expression = (a, b) => a + b;
Console.WriteLine(expression);
//获取Lambda表达式的主体
BinaryExpression body = (BinaryExpression)expression.Body;
Console.WriteLine(expression.Body);
//获取Lambda表达式的参数
Console.WriteLine(" param1: {0}, param2: {1}", expression.Parameters[0], expression.Parameters[1]);
ParameterExpression left = (ParameterExpression)body.Left;
ParameterExpression right = (ParameterExpression)body.Right;
Console.WriteLine(" left body of expression: {0}{4} NodeType: {1}{4} right body of expression: {2}{4} Type: {3}{4}", left.Name, body.NodeType, right.Name, body.Type, Environment.NewLine);
//将表达式树转换成委托并执行
Func<int, int, int> addDelegate = expression.Compile();
Console.WriteLine(addDelegate(10, 16));
Console.Read();
}
表达式树的用途
前面看到,通过Expression的派生类中的各种节点类型,我们可以构建表达式树;然后可以把表达式树转换成相应的委托类型实例,最后执行委托实例的代码。但是,我们不会绕这么大的弯子来执行委托实例的代码。
表达式树主要在LINQ to SQL中使用,我们需要将LINQ to SQL查询表达式(返回IQueryable类型)转换成表达式树。之所以需要转换是因为LINQ to SQL查询表达式不是在C#代码中执行的,LINQ to SQL查询表达式被转换成SQL,通过网络发送,最后在数据库服务器上执行。
编译器对Lambda表达式的处理
前面我们了解到,Lambda可以用来创建委托实例,也可以用来生成表达式树,这些都是编译器帮我们完成的。
编译器如何决定生成可执行的IL还是一个表达式树:
- 当Lambda表达式赋予一个委托类型的变量时,编译器生成与匿名方法同样的IL(可执行的委托实例)
- 当Lambda表达式赋予一个Expression类型的变量时,编译器就将它转换成一个表达式树
下图展示了LINQ to Object和LINQ to SQL中Lambda表达式的不同处理方式:
总结
本文中介绍了Lambda表达式,在匿名方法的基础上进一步简化了委托实例的创建,编写更加简洁、易读的代码。匿名函数不等于匿名方法,匿名函数包含了匿名方法和lambda表达式这两种概念