模拟实现.net中的Task机制:探索异步编程的奥秘

.net中使用Task可以方便地编写异步程序,为了更好地理解Task及其调度机制,接下来模拟Task的实现,目的是搞清楚:

  1. Task是什么
  2. Task是如何被调度的

基本的Task模拟实现

从最基本的Task用法开始

Task.Run(Action action)

这个命令的作用是将action作为一项任务提交给调度器,调度器会安排空闲线程来处理。
我们使用Job来模拟Task

public class Job
{
    private readonly Action _work;

    public Job(Action work) => _work = work;
    public JobStatus Status { get; internal set; }

    internal protected virtual void Invoke()
    {
        Status = JobStatus.Running;
        _work();
        Status = JobStatus.Completed;
    }

    public void Start(JobScheduler? scheduler = null)
        => (scheduler ?? JobScheduler.Current).QueueJob(this);

    public static Job Run(Action work)
    {
        var job = new Job(work);
        job.Start();
        return job;
    }
}

public enum JobStatus
{
    Created,
    Scheduled,
    Running,
    Completed
}

这里也定义了同Task一样的静态Run方法,使用方式也与Task类似

Job.Run(() => Console.WriteLine($"Job1, thread:{Thread.CurrentThread.ManagedThreadId}"));

作为对比,使用Task时的写法如下,多了await关键字,后文会讨论。

await Task.Run(()=>() => Console.WriteLine($"Task1, thread:{Thread.CurrentThread.ManagedThreadId}"));

调用Job.Run方法时,会基于给定的Action创建一个Job,然后执行job.Start(), 但Job没有立即开始执行,而是通过QueueJob方法提交给了调度器,由调度器来决定Job何时执行,在Job真正被执行时会调用其Invoke方法,此时给定的Action就会被执行了,同时会对应修改Job的状态,从Running到Completed。简单来说,.net的Task的基本工作过程与这个粗糙的Job一样,由此可见,Task/Job代表一项具有某种状态的操作

基于线程池的调度

但Task/Job的执行依赖与调度器,这里用JobScheduler来模拟,.net默认使用基于线程池的调度策略,我们也模拟实现一个ThreadPoolJobScheduler
首先看下JobScheduler,作为抽象基类,其QueueJob方法将有具体的某个调度器(ThreadPoolJobScheduler)来实现:

public abstract class JobScheduler
{
    public abstract void QueueJob(Job job);
    public static JobScheduler Current { get; set; } = new ThreadPoolJobScheduler();
}

ThreadPoolJobScheduler实现的QueueJob如下:

public class ThreadPoolJobScheduler : JobScheduler
{
    public override void QueueJob(Job job)
    {
        job.Status = JobStatus.Scheduled;
        var executionContext = ExecutionContext.Capture();
        ThreadPool.QueueUserWorkItem(_ => ExecutionContext.Run(executionContext!,
            _ => job.Invoke(), null));
    }
}

ThreadPoolJobScheduler会将Job提交给线程池,并将Job状态设置为Scheduled。

使用指定线程进行调度

JobScheduler的Current属性默认设置为基于线程的调度,如果有其它调度器也可以更换,但为什么要更换呢?这要从基于线程的调度的局限说起,对于一些具有较高优先级的任务,采用这个策略可能会无法满足需求,比如当线程都忙的时候,新的任务可能迟迟无法被执行。对于这种情况,.net可以通过设置TaskCreationOptions.LongRunning来解决,解析来先用自定义的调度器来解决这个问题:

public class DedicatedThreadJobScheduler : JobScheduler
{
    private readonly BlockingCollection<Job> _queues=new();
    private readonly Thread[] _threads;

    public DedicatedThreadJobScheduler(int threadCount)
    {
        _threads=new Thread[threadCount];
        for(int index=0; index< threadCount; index++)
        {
            _threads[index] =new Thread(Invoke);
        }
        Array.ForEach(_threads, thread=>thread.Start());

        void Invoke(object? state){
            while(true){
                _queues.Take().Invoke();
            }
        }
    }

    public override void QueueJob(Job job)
    {
        _queues.Add(job);
    }
}

在启动DedicatedThreadJobScheduler时,会启动指定数量的线程,这些线程会不停地从队列中取出任务并执行。
接下来看看.net的TaskCreationOptions.LongRunning怎么用:

await Task.Factory.StartNew(LongRunningMethod, TaskCreationOptions.LongRunning);

static void LongRunningMethod()
{
    // Simulate a long-running operation
    Console.WriteLine("Long-running task started on thread {0}.", Thread.CurrentThread.ManagedThreadId);
    Thread.Sleep(10000);
    Console.WriteLine("Long-running task finished on thread {0}.", Thread.CurrentThread.ManagedThreadId);
}

任务顺序的编排

在使用Task时,经常会使用await关键字,来控制多个异步任务之间的顺序,await实际上是语法糖,在了解await之前,先来看看最基本的ContinueWith方法。

var taskA = Task.Run(() => DateTime.Now);
var taskB = taskA.ContinueWith(time => Console.WriteLine(time.Result));
await taskB;

模仿Task,我们给Job也添加ContinueWith方法。

public class Job
{
    private readonly Action _work;
    private Job? _continue;

    public Job(Action work) => _work = work;
    public JobStatus Status { get; internal set; }

    internal protected virtual void Invoke()
    {
        Status = JobStatus.Running;
        _work();
        Status = JobStatus.Completed;
        _continue?.Start();
    }

    public void Start(JobScheduler? scheduler = null)
        => (scheduler ?? JobScheduler.Current).QueueJob(this);

    public static Job Run(Action work)
    {
        var job = new Job(work);
        job.Start();
        return job;
    }

    public Job ContinueWith(Action<Job> tobeContinued)
    {
        if (_continue == null)
        {
            var job = new Job(() => tobeContinued(this));
            _continue = job;
        }
        else
        {
            _continue.ContinueWith(tobeContinued);
        }
        return this;
    }
}

这个ContinueWith方法会将下一个待执行的Job放在_continue,这样多个顺序执行的Job就会构成一个链表。
在当前Job的Invoke方法执行结束时,会触发下一个Job被调度。
使用示例:

Job.Run(() =>
{
    Thread.Sleep(1000);
    Console.WriteLine("11");
}).ContinueWith(_ =>
{
    Thread.Sleep(1000);
    Console.WriteLine("12");
});

进一步使用await关键字来控制

要像Task一样使用await,需要Job支持有GetAwaiter方法。任何一个类型,只要有了这个GetAwaiter方法,就可以对其使用await关键字了。
c#的Task类中可以找到GetAwaiter

public TaskAwaiter GetAwaiter();

然后TaskAwaiter继承了ICriticalNotifyCompletion接口

public readonly struct TaskAwaiter<TResult> : System.Runtime.CompilerServices.ICriticalNotifyCompletion

照猫画虎,也为Job添加一个最简单的JobAwaiter

public class Job
{
    ...

    public JobAwaiter GetAwaiter() => new(this);
}

JobAwaiter的定义如下:

public struct JobAwaiter : ICriticalNotifyCompletion
{
    private readonly Job _job;
    public readonly bool IsCompleted => _job.Status == JobStatus.Completed;

    public JobAwaiter(Job job)
    {
        _job = job;
        if (job.Status == JobStatus.Created)
        {
            job.Start();
        }
    }
    
    public void GetResult() { }

    public void OnCompleted(Action continuation)
    {
        _job.ContinueWith(_ => continuation());
    }

    public void UnsafeOnCompleted(Action continuation)
    => OnCompleted(continuation);
}

添加了await后,前面的代码也可以这样写:

await F1();
await F2();

static Job F1() => new Job(() =>
{
        Thread.Sleep(1000);
        Console.WriteLine("11");
});

static Job F2() => new Job(() =>
{
        Thread.Sleep(1000);
        Console.WriteLine("12");
});

总结

回顾开头的两个问题,现在可以尝试给出答案了。

  1. Task是什么,Task是一种有状态的操作(Created,Scheduled,Running,Completed),是对耗时操作的抽象,就像现实中的一项任务一样,它的执行需要相对较长的时间,它也有创建(Created),安排(Scheduled),执行(Running),完成(Completed)的基本过程。任务完成当然需要拿到结果的,这里的Job比较简单,没有模拟具体的结果;
  2. Task是如何被调度的,默认采用基于线程池的调度,即创建好Task后,由线程池中的空闲线程执行,具体什么时候执行、由哪个线程执行,开发者是不用关心的,在具体执行过程中,
    但由于.net全局线程池的局限,对于一些特殊场景无法满足时(比如需要立即执行Task),此时可以通过TaskCreationOptions更改调度行为;

另外,await是语法糖,它背后的实现是基于GetAwaiter,由其返回ICriticalNotifyCompletion接口的实现,并对ContinueWith做了封装。

posted @ 2023-11-01 23:09  zhixin9001  阅读(356)  评论(0编辑  收藏  举报