foreach、linq 和delegate性能分析
分别使用 foreache 和 linq delegate 来查询1千万数据进行参照实验,结果如下:
环境 vs 2019 .net core 3.1
联想笔记本 windows 10
电脑配置
由于进行了多次实验,结果不同:
图一
图二
图三
图四
根据图片结果得出结论:linq <foreach<delegate
但是这个结果可能有偏差;
我们看下各个循环结果得区别
一、foreach 和 for
1、for 和 foreach 区别
for 循环
for循环
i 是初始条件:
i<100,是循环条件;
i++,是状态变化;
因此for 是需要根据 变化状态一条一条查询,所以说有多少条就变量多少条;
foreach 循环
foreach循环
foreach 可以循环用于列举集合中 或者数组中的所有元素。
foreach 语句中的表达式由 in 分割开的两个项组成。 in 右边是集合,in 左边是变量 。
foreach 循环运行过程:每一次循环时从集合中取出新的行,放到只读变量中去,如果括号中的整个表达式返回值为 true,foreach 块中的语句就能够执行。一旦集合中的元素都已经被访问到,整个表达式的值为 false,控制流程就转入到 foreach 块后面的执行语句。
因此,for 和 foreach 都是分别对每一条数据进行操作。
但是此处有一个疑点。为什么一条一条的操作和linq 读取时间有差异呢?
我们看下linq是什么样子的。
二、linq
1、什么是linq
linq是 (Language Integrated Query)的缩写 即 (语言集成查询) ,linq是集成到c# 和vb 这些语言中提供的一个数据能力的新的特性。
2、linq 的高级特性。
linq 是net 框架的扩展,它允许我们以查询数据库的方式查询数据集合。
linq 也可以允许我们从数据库 程序对象集合和xml 中读取数据结果。
借助于LINQ技术,我们可以使用一种类似SQL的语法来查询任何形式的数据。目前为止LINQ所支持的数据源有SQL Server、XML以及内存中的数据集合。开发人员也可以使用其提供的扩展框架添加更多的数据源,例如MySQL、Amazon甚至是Google Desktop。
一般来讲,这类查询语句的一个重要特点就是可以并行化执行。虽然有些情况下并行可能会带来一些问题,但这种情况非常少见。这样也就水到渠成地引出了PLINQ这个并行处理的LINQ类库。
PLINQ原名为Parallel LINQ,支持XML和内存中的数据集合。执行于远程服务器上的查询语句(例如LINQ to SQL)显然无法实现这个功能。
将LINQ语句转换为PLINQ语句极为简单——只需要在查询语句中From子句所指定的数据源的最后添加.AsParallel()即可。随后Where、OrderBy和Select子句将自动改为调用这个并行的LINQ版本。
据MSDN Magazine介绍,PLINQ可以以三种方式执行。第一种是管道处理:一个线程用来读取数据源,而其他的线程则用来处理查询语句,二者同步进行——虽然这个单一的消费线程可能并不那么容易与多个生产线程同步。不过若是能够仔细配置好负载平衡的话,仍然会极大地减少内存占用。
第二种模式叫做“stop and go”,用于处理结果集需要被一次返回时(例如调用ToList、ToArray或对结果排序)的情况。在这种模式下,将依次完成各个处理过程,并将结果统一返回给消费线程。这个模式在性能上将优于第一种模式,因为它省去了用来保持线程同步所花费的开销。
最后一种方法叫做“inverted enumeration”。该方法并不需要实现收集到所有的输出,然后在单一的线程中处理,而是将最终调用的函数通过ForAll扩展传递到每个线程中。这是目前为止最快的一种处理模式,不过这需要传递到ForAll中的函数是线程安全的,且最好不包含任何lock之类的互斥语句。
若是PLINQ中任意的一个线程抛出异常,那么所有的其他线程将会被终止。若是抛出了多个异常,那么这些异常将被组合成一个MultipleFailuresException类型的异常,但每个异常的调用堆栈仍会被保留。
因此得出结论 在正常情况下 使用linq 查询 查询效率明显应该大于 foreach;
三、delegate
1、什么是委托
委托是一种存储函数引用的类型,在事件和事件的处理时有重要的用途。
通俗的说,委托是一个可以引用方法的类型,当创建一个委托,也就创建一个引用方法的变量,进而就可以调用那个方法,即委托可以调用它所指的方法。
在这个循环对比效率上使用的是如图:
下一章详细学习委托。
在此之前查询结果数量是使用 lint<T>.count 来实现的,所以说count 也是包含在 这个时间范围内了。把获取count 放在查询时间结果后 那么 获取到的结果是,如图:
图一
图二
图三
三次执行结果由此可以得出 linq >delegate>foreach>for。
那么为什么会出现 这么大的差异呢。
因为linq 延迟加载的工作原理。
绝大部分标准的LINQ查询运算符都具有延迟加载这种特性,但也有例外:
- 那些返回单个元素或返回一个数值的运算符,如First或Count。
- 转换运算符:ToArray,ToList,ToDictonnary,ToLookup。
以上这些运算符都会触发LINQ语句立即执行,因为它们的返回值类型不支持延迟加载。
所以count 触发了linq的实际查询操作。
结论:执行效率方面 linq >delegate>foreach>for。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· 上周热点回顾(2.17-2.23)