《C#并行编程高级教程》第6章 PLINQ:声明式数据并行 笔记
PLINQ这个话题好多书都写到过,这本也没有什么特别好的地方。
几个有用和有趣的点记录一下。
顺序的不确定性
用PLINQ就一定要记住并行后会导致顺序不确定的问题。解决方案就是AsOrdered或者orderby子句。
var keysWith10Letters = from key in Keys.AsParallel().AsOrdered()
where (CountLetters(key) >= 10)
&& (key.Contains('A'))
&& (key.Contains('F'))
&& (key.Contains('9'))
&& (!key.Contains('B'))
select key;
var keysWith10Letters = from key in Keys.AsParallel()
where (CountLetters(key) >= 10)
&& (key.Contains('A'))
&& (key.Contains('F'))
&& (key.Contains('9'))
&& (!key.Contains('B'))
orderby key
select key;
where (CountLetters(key) >= 10)
&& (key.Contains('A'))
&& (key.Contains('F'))
&& (key.Contains('9'))
&& (!key.Contains('B'))
select key;
var keysWith10Letters = from key in Keys.AsParallel()
where (CountLetters(key) >= 10)
&& (key.Contains('A'))
&& (key.Contains('F'))
&& (key.Contains('9'))
&& (!key.Contains('B'))
orderby key
select key;
PLINQ中的数据分区
这部分讲的不错,但是需要图片才比较好讲解。在书的P229-233
PLINQ中的规约操作
这里指的就是聚合函数。普通的求和,求平均值类的,反正提供好了,用就好了。
有趣的是,提供了一个Aggregrate函数,可以自定义聚合函数。
给一段求方差的代码段
int[] inputIntegers = { 0, 3, 4, 8, 15, 22, 34, 57, 68, 32, 21, 30 };
var mean = inputIntegers.AsParallel().Average();
var standardDeviation = inputIntegers.AsParallel().Aggregate(
// Seed
0d,
// Update accumulator function
(subTotal, thisNumber) => subTotal +
Math.Pow((thisNumber - mean), 2),
// Combine accumulators function
(total, thisTask) => total + thisTask,
// Result selector
(finalSum) => Math.Sqrt((finalSum /
(inputIntegers.Count() - 1))));
var mean = inputIntegers.AsParallel().Average();
var standardDeviation = inputIntegers.AsParallel().Aggregate(
// Seed
0d,
// Update accumulator function
(subTotal, thisNumber) => subTotal +
Math.Pow((thisNumber - mean), 2),
// Combine accumulators function
(total, thisTask) => total + thisTask,
// Result selector
(finalSum) => Math.Sqrt((finalSum /
(inputIntegers.Count() - 1))));
mean的求值就是内置的聚合函数。
自定义的聚合函数给需要四个参数(另有重载版本,可以不需要这么多参数)
自定义并行的聚合函数的思路是,定义一个初始值,处理每一项,处理每一个分区,得到最终结果。
这也对应了Aggregrate方法的四个参数。
第一个参数 给一个累计的初始值
第二个参数 对每一项进行操作,并累计效果
第三个参数 对每一个分区进行操作,并累计效果
第四个参数 做最后的整理
取消PLINQ
使用WithCancellation,传入一个CancellationToken参数
制定并行度
使用WithDegreeOfParallelism,传入一个希望的最大并行度
处理异常
需要注意延时执行的效果,一定要在使用的时候进行捕捉。