探索WF4 Beta2的工作流对象模型

Posted on 2009-10-29 22:43 金旭亮阅读(3732) 评论(13) 编辑收藏举报

探索WF4 Beta2的工作流对象模型

随着VS2010 BETA2的发布，大家对.NET 4.0技术的研究热情随之高涨。在整个.NET 4.0所引入的新技术中，工作流可谓是变化最大的部分。WF4与WF3几乎可以看成是两个完全不同的产品。

对于WF3的编程模型，已有相关的技术书籍介绍了，在网上也可以搜到有关的资源。但对于WF4，却几乎找不到任何深入介绍其对象模型的文章。

我以Reflector作为工具，反汇编了WF4的源代码，通过仔细阅读，粗步理出了一个头绪，在本文中进行介绍，期望能起到一个抛砖引玉的作用，帮助大家深入地把握WF4的技术内幕。

呵呵，第一次在博客园发文，希望大家多多鼓励。

1 Acitvity的继承树

在WF4中，Activity类是最顶层的基类。任何一个工作流都由至少一个Activtiy构成。以下是WF4中Activity的继承树：

在真实的工作流中，各个Activity可以相互嵌套，形成一个树型结构，最底层的叶子通常就是上图中最底层类（如CodeActivity）的实例。

最顶层的Activity类提供了一个可以供子类重写的InternalExecute()方法：

internal virtual void InternalExecute(ActivityInstance instance, ActivityExecutor executor, BookmarkManager bookmarkManager);

子类可以重写此方法，在此方法中实现各种功能，这个方法在WF4内部非常重要，许多东西都与它相关。

为了方便地供开发者自定义业务处理逻辑，诸如CodeActivity之类最底层的类，另定义了一个抽象的Execute()方法：

protected abstract void Execute(CodeActivityContext context);

当开发者自定义Activity时，就可以直接地重写此方法。

简言之，工作流的运行就体现为Activity对象树中叶子节点Execute方法（或类似的方法，比如DynamicActivity是InternalExecute方法，AsyncCodeActivity是BeginExecute和EndExecute方法）的执行。

2 WF4中工作流的执行原理

首先要明确，在WF4中，如果使用WorkflowInvoker类来启动工作流时：

WorkflowInvoker.Invoke(new Workflow1());

工作流Workflow1将在调用者的线程中执行。这种情况下，工作流的执行类似于方法调用，是最简单的执行模式。

然而，如果使用WorkflowApplication启动工作流，工作流实例将在调用者线程之外的另一个线程中运行：

WorkflowApplication wpp = new WorkflowApplication(new Workflow1());

wpp.Run();

而且，这个“另外的工作线程”是线程池中的线程。

不管是由哪个线程负责执行工作流，有一个原则是很重要的：

单个工作流实例是单线程执行的，哪怕诸如Parallel Activity给你一个多分支“并行”运行的假象。

事实上，Parallel Activity采用在单线程中“轮换执行”各分支。当一个分支进入空闲“Idle”时，工作流调度器调度下一分支投入运行。所果所有分支都不包括使本分支进入Idle状态的Activtity（比如有一个Delay Activity或创建了书签），则Parallel Activity按从左到右的顺序执行各分支。

那么，构成工作流的各个Activity实例是如何执行的？

WF运行时在内部为每个工作流维护了一个工作项队列。然后，创建一个Scheduler类的实例来负责从此工作项队列中取出和追加工作项，并执行之。

这里要说说这个工作项队列，在Scheduler类的代码中可以找到它的声明：

private Quack<WorkItem> workItemQueue;

这里有一个奇怪的Quack<T>泛型类，我仔细看了一下，其实它就是一个泛型队列，但它有一点特殊之处：

Quack<T>泛型类在内部使用一个数组来保存数据：

private T[] items;

初始时，为队列分配可容纳4个T类型对象的内存空间，当不断增加对象而需要扩充空间时，就分配一个“当前所占内存空间*2”的新数组，再将老数组中的内容复制到新数组中。

很明显，在两个数组中复制元素会花费系统资源，我不知道为何WF4的设计者这样设计，估计是他们有其他的考虑。

队列中的WorkItem对象很有趣，它代表一个将被执行的Activity实例，这里暂时放下，一会儿还会介绍它。

Scheduler对象的工作可以简述如下：

它从队列中取出一个WorkItem对象，然后将其委托给线程池中的线程（如果工作流由WorkApplication以异步方式启动执行）或调用者线程（如果工作流由WorkflowInvoker以同步方式启动执行）执行。这些线程将负责调用WorkItem所封装的Activity实例的Execute()方法（或类似的方法，如前所述）。

3 深入分析Activity执行的流程

一个Activity实例到底是如何执行的？一切得从WorkItem类开始。

WorkItem是一个抽象基类,提供了几个抽象方法，其中最重要的就是Execute()方法：

internal abstract class WorkItem

{

//……

private ActivityInstance activityInstance;

public abstract bool Execute(ActivityExecutor executor,

BookmarkManager bookmarkManager);

}

上述声明中还有两个很重要的类ActivityInstance和ActivityExecutor。

ActivityInstance代表着正在运行的一个Activity实例，它包容一堆的internal方法可以完成Activity的执行（Execute）取消（Cancel）和放弃(Abort)的功能。 ActivityExecutor则负责调用ActivityInstance中的这些方法。

WorkItem有一堆的子类，这些子类又派生出“孙”类。比如，其中的一个分支如下：

不管有几个子孙，后代一般都重写了WorkItem所定义的Execute()抽象方法。

我们以ExecuteRootWorkItem类为例，顾名思义，这应该是与工作流中最顶层的Activity相对应的WorkItem。它的Execute()方法如下所示：

public override bool Execute(ActivityExecutor executor, BookmarkManager bookmarkManager)

{

return base.ExecuteBody(executor, bookmarkManager, this.resultLocation);

}

它将调用基类ExecuteActivityWorkItem的ExecuteBody()方法，此方法的关键代码如下：

protected bool ExecuteBody(ActivityExecutor executor, BookmarkManager bookmarkManager, Location resultLocation)

{

//……

base.ActivityInstance.Execute(executor, bookmarkManager);

//……

}

可以看到，它直接跳去执行最顶层基类WorkItem所定义的ActivityInstance对象的Execute()方法。此方法的代码如下：

internal void Execute(ActivityExecutor executor, BookmarkManager bookmarkManager)

{

//……

this.Activity.InternalExecute(this, executor, bookmarkManager);

}

注意ActivityInstance实际上封装了一个Activity对象：

public sealed class ActivityInstance : ActivityInstanceMap.IActivityReference

{

public Activity Activity { get; internal set; }

//……

}

所以，ActivityInstance对象的Execute()方法实际上执行的是Activity对象的InternalExecute()方法。再追踪下去：

internal virtual void InternalExecute(ActivityInstance instance, ActivityExecutor executor, BookmarkManager bookmarkManager)

{

//……

executor.ScheduleActivity(this.runtimeImplementation, instance, null, null, null);

}

　　注意：上述代码是Acitivity对InternalExecute（）默认的实现方式，它的子类（比如CodeActivity）通常会重写它。

可以看到，在ActivityInstance对象的Execute()方法中，执行流程转给了从前面一路传送过来的ActivityExecutor对象，由此对象的ScheduleActivity方法负责将Activity插入到工作项队列中。

ActivityExecutor.ScheduleActivity方法又进行了一个“倒手”，调用自己的ScheduleBody()方法：

private ActivityInstance ScheduleActivity(……)

{

//……

this.ScheduleBody(scheduledInstance, requiresSymbolResolution, argumentValueOverrides, resultLocation);

}

在ScheduleBody()方法中，“佛祖”终于现出真身，我们看到了Scheduler的身影：

internal void ScheduleBody(ActivityInstance activityInstance, bool requiresSymbolResolution, IDictionary<string, object> argumentValueOverrides, Location resultLocation)

{

if (resultLocation == null)

{

//……

this.scheduler.PushWork(new ExecuteExpressionWorkItem(activityInstance, requiresSymbolResolution, argumentValueOverrides, resultLocation));

//……

}

在上述代码中，Scheduler对象将activityInstance转换为了一个ExecuteExpressionWorkItem，然后将其插入到工作项队列中等待执行。

　　现在我们看到，默认情况下，对ExecuteRootWorkItem的执行将导致一个新的ExecuteExpressionWorkItem工作项被插入到工作项队列中。

4 工作项队列中的工作项是如何调度执行的？

Scheduler类负责工作项的调度执行。

在Scheduler类的构造函数中，挂接了一个回调函数OnScheduledWork：

static Scheduler()

{

//……

onScheduledWorkCallback = Fx.ThunkCallback(new SendOrPostCallback(Scheduler.OnScheduledWork));

}

在OnScheduledWork（）函数中，揭露出了任务项调度是如何进行的秘密：

private static void OnScheduledWork(object state)

{

//取出队列中的第一个工作项

WorkItem firstWorkItem = scheduler.firstWorkItem;

if ((scheduler.workItemQueue != null) && (scheduler.workItemQueue.Count > 0))

{

scheduler.firstWorkItem = scheduler.workItemQueue.Dequeue();

}

else

{

scheduler.firstWorkItem = null;

}

//执行这一工作项

continueAction = scheduler.callbacks.ExecuteWorkItem(firstWorkItem);

//……

}

下面是ExecuteWorkItem（）方法的代码，可以看到，最后调度器还是委托activityExecutor来执行Activity的：

public Scheduler.RequestedAction ExecuteWorkItem(WorkItem workItem)

{

Scheduler.RequestedAction objA = this.activityExecutor.OnExecuteWorkItem(workItem);

//……

}

ActivityExecutor的OnExecuteWorkItem（）方法有很多代码，其中关键的就是以下这几句：

internal Scheduler.RequestedAction OnExecuteWorkItem(WorkItem workItem)

{

//……

propertyManagerOwner.PropertyManager.SetupWorkflowThread();

if ((abortException == null) && !workItem.Execute(this, this.bookmarkManager))

{

return Scheduler.YieldSilently;

}

//……

}

我们终于发现了调用工作项的Execute()方法的语句。

有的朋友可能会疑惑，我们的探索之旅从WorkItem.Execute()方法开始，转了一圈怎么又回到了WorkItem.Execute()方法？这样一来，调用工作项的WorkItem.Execute()方法将导致一个工作项被加入到队列中，然后当此工作项被执行时，它又将一个工作项加入到队列中，这会不会引发无限递归？

事实上这正是我们想要的效果。因为一个工作流实例实际上就是一个层层嵌套的递归的结构，这种设计使得执行其顶层Activity对象的Execute()方法时，会将其子Activity所对应的WorkItem加入到队列中加以递归执行。

很明显，对于那些不包容子Activity的Activity，我们应该“打断”这种递归执行的过程。WF4是怎么做到的？

以一个实例来说明更好。请看以下自定义的Activity:

public sealed class Prompt : CodeActivity

{

public InArgument<string> Text { get; set; }

protected override void Execute(CodeActivityContext context)

{

Console.Write(Text.Get(context));

}

注意上述Activity重写了基类CodeActivity的Execute()方法，此方法一执行完毕就会返回。

前面说过，对工作项队列中WorkItem.Execute()方法的调用，最终将转换为对ActivityInstance对象的Execute()方法的调用。而ActivityInstance又包容了最终的Activity对象实例，并将调用转给这一最终对象的InternalExecute()方法，为方便起见，重贴此方法代码如下：

internal void Execute(ActivityExecutor executor, BookmarkManager bookmarkManager)

{

//……

this.Activity.InternalExecute(this, executor, bookmarkManager);

}

在我们的自定义Activity中，没有重写CodeActivity的InternalExecute()方法(事实上也不可能，因为此方法是Sealed的)，所以，被调用的实际上是基类CodeActivity的InternalExecute()方法。以下是CodeActivity的InternalExecute（）方法代码：

internal sealed override void InternalExecute(ActivityInstance instance, ActivityExecutor executor, BookmarkManager bookmarkManager)

{

//……

this.Execute(context);

//……

}

非常清楚，它应用了多态特性，调用子类重写的Execute()方法，注意，它并没有调用最顶层Activity类所提供的InternalExecute()方法。

所以，问题的关键在于最顶层基类Activity的InternalExecute（）方法，默认情况下，此方法将会通过 ActivityExecutor.ScheduleActivity(）方法的调用将一个工作项加入到队列中，但CodeActivity没调用Activity基类的InternalExecute（）方法而是重写了此方法，所以就打断了“递归”调用链。

5 小结

不知道朋友们是不是有点昏了，没办法，WF4内部就是有这么多的弯弯绕。　　

简单地说：

　　工作流执行时，所有需要被执行的Activity会被封装为一个WorkItem，被放到一个工作项队列中，然后由WF4调度器(其实就是Scheduler类的实例）负责从此队列中取出工作项执行。

工作项的执行可以由线程池中的线程承担。，也可以由调用者线程来承担。

WF4内部的工作原理非常复杂，事实上我们也没有必要了解其每个技术细节。但如果能了解其大致的内部原理还是非常有用的，它能帮助我们避开陷阱，真正地把技术用好。

对于技术，不仅要知其然，还要知其所以然。才能真正拥有了自由。

刷新页面返回顶部

金旭亮

公告