【读书笔记】.Net并行编程高级教程(二)-- 任务并行
2015-10-29 08:13 stoneniqiu 阅读(2342) 评论(2) 编辑 收藏 举报前面一篇提到例子都是数据并行,但这并不是并行化的唯一形式,在.Net4之前,必须要创建多个线程或者线程池来利用多核技术。现在只需要使用新的Task实例就可以通过更简单的代码解决命令式任务并行问题。
1.Task及它的生命周期
一个Task表示一个异步操作,它的创建和执行都是独立的,因此可以对相关操作的执行拥有完全的控制权;当有很多异步操作作为Task实例加载的时候,为了充分利用运行时的逻辑内核,任务调度器会尝试并行的运行这些任务,当然任务都是有额外的开销,虽然要小于添加线程的开销;
对Task实例的生命周期的理解非常重要。一个Task的执行,取决于底层硬件和运行时可用的资源。因此Task实例的状态会不断的发生改变,而一个Task实例只会完成其生命周期一次,当Task到达它三种可能的最终状态只后,它就回不去之前的任何状态了。
Task实例有三种可能的初始状态,Created是Task构造函数创建实例的初始状态,WaitForActivation是子任务依赖其他任务完成后等待调度的初始状态,WaitingToRun是通过TaskFactory.StartNew所创建任务的初始状态。表示正在等待调度器挑选自己并运行。
任务开始执行,状态就变为TaskStatus.Runing。如果还有子任务,主任务的状态会转变到TaskStatus.WaitingForChildrenToComplete状态。并最终到达,Canceled,Faulted和RunToCompletion 三种状态。从字面理解就是任务取消,出错和完成。
2.任务并行。
前面我们通过Parallel.Invoke来并行加载方法。
Parallel.Invoke(GenerateAESKeys,GenerateMD5Has);
通过Task实例也能完成同样的工作。
var t1 = new Task(GenerateAESKeys); var t2 = new Task(GenerateMD5Has); t1.Start(); t2.Start(); Task.WaitAll(t1, t2);
Start方法对委托进行初始化。 WaitAll方法会等待两个任务的执行完成之后再往下走。
可以看见,执行过程中,任务的状态不断的发生变化。可以给WaitFor方法加上毫秒数。看任务是否会在指定时间内完成。
if(!Task.WaitAll(new[]{t1,t2},3000)) { Console.WriteLine("任务执行超过3秒"); Console.WriteLine(t1.Status.ToString()); Console.WriteLine(t2.Status.ToString()); }
即使到达了指定时间,任务还是继续执行。
同样任务本身也是可以等待
if (t1.Wait(3000)) { Console.WriteLine("任务t1执行超过3秒"); Console.WriteLine(t1.Status.ToString()); }
3.通过取消标记取消任务。
可以通过CancellationToken 来中断任务的执行。这需要再委托中添加一些代码,创建可以取消的任务。
private static void GenerateMD5HasCancel(CancellationToken ct) { ct.ThrowIfCancellationRequested(); var sw = Stopwatch.StartNew(); for (int i = 0; i < NUM_AES_KEYS; i++) { var md5M = MD5.Create(); byte[] data = Encoding.Unicode.GetBytes(Environment.UserName + i); byte[] result = md5M.ComputeHash(data); string hexString = ConverToHexString(result); ct.ThrowIfCancellationRequested(); } Console.WriteLine("MD5:" + sw.Elapsed.ToString()); }
Console.WriteLine("任务开始..."); var cts = new CancellationTokenSource(); var ct = cts.Token; var sw = Stopwatch.StartNew(); var t1 = Task.Factory.StartNew(() => GenerateMD5HasCancel(ct), ct); var t2 = Task.Factory.StartNew(() => GenerateAESKeysCancel(ct), ct); //1秒后取消任务 Thread.Sleep(1000); cts.Cancel(); try { if (!Task.WaitAll(new[] { t1,t2}, 1000)) { Console.WriteLine("任务执行超过1秒"); Console.WriteLine(t1.Status.ToString()); } } catch (AggregateException ex) { foreach (var exc in ex.InnerExceptions) { Console.WriteLine(exc.ToString()); } if (t1.IsCanceled) { Console.WriteLine("任务1取消了..."); } Console.WriteLine(sw.Elapsed.ToString()); Console.WriteLine("结束"); }
CancellationTokenSource能够初始化取消的请求,而CancellationToken能将这些请求传递给异步操作;上面的方法通过Task类的Factory方法得到一个TaskFactory实例,相比Task直接创建任务,这个实例可以使用更多的功能。而StartNew 等价于用Task构造函数创建一个Task并调用Start方法执行。
直接在Debug下面运行,程序会在异常的地方中断。直接运行exe得到上面的结果。
ThrowIfCancellationRequested在每一次循环迭代都会执行,内部是判断任务取消后抛出一个OperationCanceledException的异常,来避免运行不必要的循环和其他命令。
public void ThrowIfCancellationRequested() { if (IsCancellationRequested) ThrowOperationCanceledException(); } private void ThrowOperationCanceledException() { throw new OperationCanceledException(Environment.GetResourceString("OperationCanceled"), this); }
如果有代码正在等待取消,还会自动抛出一个TaskCanceledException异常。会包含在AggregateException中。
4.处理异常。
修改上面的方法抛出一个异常。
private static void GenerateMD5HasCancel(CancellationToken ct) { ct.ThrowIfCancellationRequested(); //....if (sw.Elapsed.TotalSeconds > 0.5) { throw new TimeoutException("超时异常0.5秒"); } ct.ThrowIfCancellationRequested(); } Console.WriteLine("MD5:" + sw.Elapsed.ToString()); }
修改Main方法的Catch。
if (t1.IsFaulted) { foreach (var exc in ex.InnerExceptions) { Console.WriteLine(exc.ToString()); } Console.WriteLine(t1.Status.ToString()); }
执行结果:
当出现异常时,任务的状态就会转换为Faulted。并不会影响另外一个任务的执行。
5.从任务返回值。
前面的方法都是没有返回值,得到任务的返回值需要使用Task<TResult>实例,TResult要替换为返回的类型。修改AES方法。返回一个指定前缀的List<String>
GenerateMD5HasList:
private static List<string> GenerateMD5HasList(CancellationToken ct, char prefix) { ct.ThrowIfCancellationRequested(); var sw = Stopwatch.StartNew(); var list = new List<string>(); for (int i = 0; i < NUM_AES_KEYS; i++) { var md5M = MD5.Create(); byte[] data = Encoding.Unicode.GetBytes(Environment.UserName + i); byte[] result = md5M.ComputeHash(data); string hexString = ConverToHexString(result); if (hexString[0] == prefix) { list.Add(hexString); } ct.ThrowIfCancellationRequested(); } Console.WriteLine("MD5:" + sw.Elapsed); return list; }
Console.WriteLine("任务开始..."); var cts = new CancellationTokenSource(); var ct = cts.Token; var t1 = Task.Factory.StartNew(() => GenerateMD5HasList(ct,'A'), ct); //等待执行完成 t1.Wait(); var res = t1.Result; for (int i = 0; i < res.Count; i++) { Console.WriteLine(res[i]); }
而这时的StartNew创建的类型是Task<List<String>>.StartNew源码如下:
public Task<TResult> StartNew<TResult>(Func<TResult> function) { StackCrawlMark stackMark = StackCrawlMark.LookForMyCaller; Task currTask = Task.InternalCurrent; return Task<TResult>.StartNew(currTask, function, m_defaultCancellationToken, m_defaultCreationOptions, InternalTaskOptions.None, GetDefaultScheduler(currTask), ref stackMark); }
我们还可以将任务串联起来。比如上面的代码。避免写太多代码来检查前面一个任务是否完成。而ContinueWith这个方法可以用来串联多个任务。
var t1 = Task.Factory.StartNew(() => GenerateMD5HasList(ct,'A'), ct); var t2 = t1.ContinueWith((t) => { for (int i = 0; i < t.Result.Count; i++) { Console.WriteLine(t.Result[i]); } }); //可以等待t2执行完成 t2.Wait();
如果需要设置继续的条件,就要用到TaskContinuationOptions,它是一个枚举类型,用来控制另一个任务执行和调度的可选行为
var t2 = t1.ContinueWith((t) => OtherMethod(t), TaskContinuationOptions.NotOnCanceled);
NotOnCanceled,就是表示上个任务不取消的情况下执行。例如还有NotOnFaulted.如果上一个任务抛出了异常,那么就不会执行。这里就不一一例举了。
小结:这一章主要是将了基于任务的编程模型,学习了任务的创建、状态,以及如何取消、捕获异常和获得返回值,并能串行任务,任务的延续不仅能简化代码,而且还能帮助调度器对很快就要执行的任务采取正确的操作。下一章学习并发集合。
阅读书籍:《C#并行编程高级教程》 链接: 下载链: http://pan.baidu.com/s/1bn1BdBx 密码: fn2d
喜欢看书,也喜欢分享书籍(不限技术书籍)的朋友,诚邀加入书山有路群q:452450927 。
第三期书山有路,大家正在读《女人的起源》。 链接: http://pan.baidu.com/s/1ntEhMHz 密码: 84d8
在喜欢你的人那里,去热爱生活;在不喜欢你的人那里,去看清世界。
你的关注和支持是我写作的最大动力~
书山有路群:452450927