Does the “LINQ to Objects” provider have built-in performance optimization?
让我们从基础开始,可能会重复一些你已经知道的信息。在LINQ性能优化中最重要的一点,当然是延迟执行。那便意味着当你声明一个变量并分配给它一个查询字符串,其查询字符串并没有立即执行
// Query is not executed.
var query = from item in storage select item;
变量query现在存储着命令,查询执行被延迟直到你从变量query请求获取数据。这通常发生在如下几种情况:foreach循环,或当你调用一个聚集函数像Min,Max和Average,或当你使用ToList或ToArray方法缓存该查询结果。
// foreach循环。 foreach (var item in query) Console.WriteLine(item); // Count函数。 int total = query.Count(); // ToArray方法。 var cachedQuery = query.ToArray();
现在让我们来看看幕后究竟发生了什么。在查询执行的时候是否有什么编译器级的优化发生?答案是yes。然而,这里有个陷阱。从现在起我们将只讨论使用“LINQ to Objects”提供程序对IEnumerable和IEnumerable<T>集合的查询。对于其他LINQ提供程序,包括LINQ to SQL和LINQ to XML,可能应用的是不同的优化规则。
注意:人们常常认为,由于延迟执行,执行第一次查询需要花费更长时间。然而,在LINQ to Objects中,第一次执行和之后的每一次并没有差别。其他LINQ提供程序的规则可能不同(比如,这里可能有些会进行缓存),但你需要参考特定的提供程序的详细文档。
LINQ to Objects查询在下面这些情况下会做优化:
- 一些方法调用会被优化,如果数据源实现了一个必要的接口。下面表格列出了这些优化。
LINQ方法 | 优化 |
Cast | 如果数据源已经对给定的类型T实现接口IEnumerable<T>,则会直接返回数据序列而不需要转换。 |
Contains | 如果数据源实现了接口ICollection或ICollection<T>,其接口的相应的方法会被使用。 |
Count | 如果数据源实现了接口IList或IList<T>,接口的Count方法和索引器会被使用。 |
ElementAt ElementAtOrDefault First FirstOrDefault Last LastOrDefault Single SingleOrDefault |
如果连续的一个或多个Select操作后面跟着连续的一个或多个Where操作,查询只会创建一个IEnumerable或IEnumerable<T>对象而不会创建中间对象。 |
考虑下面的查询:
var query = from item in storage where item.Category = "Food" where item.Price < 100 select item;
在这里,查询只会创建一个IEnumerable对象。
- 如果你查询一个数组或List,接口IEnumerable或IEnumerable<T>不会在foreach循环中使用枚举器。相反,在使用前会创建一个数组或List的简单for循环,元素被直接访问。
此外,where操作符实现了简单的if语句,所以不会有中间的枚举器产生。
再次说明,其他LINQ提供程序可能拥有它们自己的性能优化规则。但上面的规则应该能给你一些怎么使用LINQ to Objects的意见。
原文:Alexandra Rusina Does the “LINQ to Objects” provider have built-in performance optimization?
*也是准备翻译,正好tianfan做过了。所以直接转到这里。辛苦辛苦