C# 标准查询表达式

一、标准查询运算符

1、C#提供了标准查询运算符,例如我想选择专利一系列(pantents)中以年份19开头的专利,可以用如下语句:

            IEnumerable<Patent>  pantentWhere = pantents.Where(pantent => 
                                                                pantent.YearOfPublicaton.StartsWith("19"));

当然,此处的语句只是定义了查询,此时pantentWhere并没有内容,后面Lambda表达式指定的查询并没有执行,只有当遍历pantentWhere集合的时候才开始执行这个查询规则,这是C#中标准查询的“推迟执行”

2、投射

专利类包含了 名字  年份  应用号  发明者 等,如果我想将专利类的集合中 每个专利的类型都变为只包含 名字与年份的类型,那么可以使用select做到,代码如下:

1 var pantentSelect = pantents.Select(
2                 pantent => 
3                 { 
4                     return new 
5                     { 
6                         Title = pantent.Title, 
7                         Year = pantent.YearOfPublicaton 
8                     }; 
9                 });

可以看到,Lambda表达式返回了一个包含 名字与年份的类型。而当遍历pantentSelect时,其投射语句执行,它则是有[(姓名,值),(年份,值)]构成的集合。

3、排序

利用标准查询运算符OrderByDescending 与 ThenByDescending 可以完成多条件的排序,代码如下:

1 IEnumerable<Patent> pantentOrder = pantents.OrderByDescending(pantent => 
2                                                           pantent.YearOfPublicaton).ThenByDescending(
3                                                           pantent => pantent.Title);

可以看到,只用了一个OrderBy,它会获取并且只会获取一个成为KeySelector的参数来排序,例如本例中的YearOfPublicaton。如果要继续按照第二个关键字排序,只能用ThenBy,在OrderBy的基础上执行。而连着使用多个OrderBy只会撤销上一个OrderBy,所以要用ThenBy,而不是继续使用OrderBy。

此处仅仅简单的列出几项,因为如果执行比较复杂的查询与投射,将会产生比较繁琐难懂的代码。因此,C# 3.0中引入了标准查询表达式,一种更类似于SQL语言的

二、标准查询表达式

1、简单示例,下段代码完成的功能是检索出不含有*的单词:

 1 class Program
 2     {
 3         static string[] Keywords = { "*a", "*b", "*c", "*d", "*e", "*f", "a", "b", "c", "d", "e", "f", "g", "h", "i"};
 4         static void Main(string[] args)
 5         {
 6             ShowContextualKeyword1();
 7         }
 8         public static void ShowContextualKeyword1()
 9         {
10             IEnumerable<string> selection = from word in Keywords
11                                             where !word.Contains('*')
12                                             select word;
13             foreach (string s in selection)
14             {
15                 Console.WriteLine(" " + s);
16             }
17         }
18     }

值得详细说一下的是类型推断:select投射回的是word的集合,word的类型是from后面的那个word,从Keywords推断得到。Keywords是一个string的集合,所以word是string类型,因此select投射到的是IEnumerable<string>

 2、改变返回类型。

select不仅可以返回原始类型,也可以返回指定的类型,我个人总结的是 他会返回select后面的变量的集合类型。

如下代码,返回的不是fileName的集合,而是FileInfo的集合:

1   public static void List1(string rootDirectory, string searchPattern)
2         {
3             IEnumerable<FileInfo> files = from fileName in Directory.GetFiles(rootDirectory, searchPattern)
4                                           select new FileInfo(fileName);
5             foreach (FileInfo file in files)
6             {
7                 Console.WriteLine(".{0}({1})",file.Name,file.LastWriteTime);
8             }
9         }

 当然,3.0允许程序员不必显示声明投射的类型,而可以使用匿名类型,如下代码所示:

 1 public static void List2(string rootDirectory, string searchPattern)
 2         {
 3             var files = from fileName in Directory.GetFiles(rootDirectory, searchPattern)
 4                         select new 
 5                         {
 6                             Name = fileName,
 7                             LastWriteTime = File.GetLastWriteTime(fileName)
 8                         };
 9             foreach (var file in files)
10             {
11                 Console.WriteLine(".{0}({1})", file.Name, file.LastWriteTime);
12             }
13         }

如果select的原始数据的列特别多,改变投射类型则显得十分有优势,只需选出需要关注的几列即可,而不用全部都检索出来。

3、筛选(where)

筛选条件靠断言来表示,即返回布尔值的一个,真就接受,假就放弃。代码如下,功能是筛选出一个月之前修改的文件:

 1  static void FindMonthOldFiles(string rootDirectory, string searchPattern)
 2         {
 3             // 筛选出一个月之前访问的数据
 4             IEnumerable<FileInfo> files = from fileName in Directory.GetFiles(rootDirectory, searchPattern)
 5                                           where File.GetLastWriteTime(fileName) < DateTime.Now.AddMonths(-1)
 6                                           select new FileInfo(fileName);
 7             foreach (FileInfo file in files)
 8             {
 9                 string relativePath = file.FullName.Substring(3);
10                 Console.WriteLine(".{0}.({1})", relativePath, file.LastWriteTime);
11             }
12         }

4、排序

下面代码展示了一种排序:首先按照文件名长度降序排序,然后按照文件名升序排序(不显示声明升序还是降序的,默认升序):

 IEnumerable<string> fileNames = from fileName in Directory.GetFiles(rootDirectory,searchPattern)
                                            orderby (new FileInfo(fileName)).Length descending,fileName
                                            select fileName;

多个排序条件用逗号隔开,重要性依次降低。但是如果我想投射一个FileInfo的集合怎么办呢?可能会有如下代码:

1             IEnumerable<FileInfo> fileNames = from fileName in Directory.GetFiles(rootDirectory,searchPattern)
2                                             orderby (new FileInfo(fileName)).Length descending,fileName
3                                             select new FileInfo(fileName);

那么问题来了。看第2行与第3行,这样写会每一次访问,都会实例化两个FileInfo,十分浪费系统资源,于是C#3.0隆重推出了let字句。

5、let子句

let 子句添加的表达式可以在整个查询表达式的范围内使用,从而避免重复实例化,写法如下:

1 IEnumerable<FileInfo> fileNames = from fileName in Directory.GetFiles(rootDirectory,searchPattern)
2                                               let file = new FileInfo(fileName)
3                                               orderby file.Length descending, fileName
4                                               select file;

6、编译

实际上,使用查询运算符与查询表达式对CIL CLR没有影响,编译器会将查询表达式转化成标准查询运算符。虽然属于语法糖级别的,但是平时尽可能多使用查询表达式,除非在某些特定情况下,再使用标准查询运算符。

posted @ 2014-12-04 22:52  TNT-boom  阅读(866)  评论(0编辑  收藏  举报