Implementing a builder: Zero and Yield
原文地址:http://fsharpforfunandprofit.com/posts/computation-expressions-builder-part1/
前面介绍了bind和continuation,以及包装类型的使用,现在我们已经准备讲述“builder”类型的一系列的方法了。
如果你看过MSDN documentation,你会发现“builder”类型的方法不仅仅是Bind和Return,还有其他方法如Delay和Zero,这两个方法是干啥用的?这正是本篇以及以后几篇讲述的主题。
计划
为了论证如何创建一个builder类,我们将创建一个自定义工作流,它使用所有可能的builder类方法。
但是比起从头开始,没有上下文就解释那些builder类方法是什么意思,我们不如采用自底向上的方式,从一个简单的工作流开始,并在需要解决某个问题或者错误的时候添加有关的方法,这样会更加自然些。在这个过程中,你将逐渐理解F#在细节上如何处理computation expression的。
对这个过程做一个提纲
- 首先看一看,作为一个基本工作流,哪些方法是必需的。我们将介绍Zero,Yield,Combine和For
- 然后,我们将讨论如何延迟执行代码,即,只在需要的时候计算值。我们介绍Delay和Run,然后看延迟计算的具体实现。
- 最后,我们讨论剩下的方法:While,Using和异常处理。
开始前
在我们开始创建工作流之前,有几点说明
computation expressions文档说明
也许你已经注意到,MSDN文档中关于computation expressions的说明是非常简陋的,尽管它并非不准确,但是仍然容易会误导初学者。例如,builder类方法的签名比看上去更加灵活,这有助于实现一些特性(features),你在工作中如果不随时查阅文档说明,那这些特性则很不明显。后面我们会给出一个例子说明。
如果你需要更详细的文档说明,那么我将推荐两个源。如果想更为详细地纵览computation expressions背后的概念,有一个很好的资源,是由Tomas Petricek和Don Syme写的论文"The F# Expression Zoo"。如果需要最新的准确的科技文档,可以阅读F# language specification,它有一章节是关于computation expressions的。
包装类型和未包装类型
当想去理解文档中的函数签名,记住一点,我们通常把未包装类型记为'T,包装类型记为M<'T>。这样以后当看到Return方法的签名为'T -> M<'T>,它表示Return方法有一个未包装类型的输入参数,输出参数是要给包装类型。
跟这个系列的前面几篇文章相同,我将继续使用“未包装”和“包装”来描述这些类型之间的关系,但是我们接下去的讨论中可能会稍作改变,使用其他术语,如“computation type”代替“wrapped type”。我希望当碰到这个称呼改变时,我们对这个作改变的理由是清楚的并能理解。
当然,在我的例子中,我将尽量让事情简单,比如使用
let! x = ...wrapped type value...
但是,这其实是一个过分简化的表达式,也可以准确的说,“x”可以是任意模式而不仅是一个值,“wrapped type value”可以是一个表达式,这个表达式能计算得到一个包装类型。MSDN文档使用这种更加精确的方法,它在定义中使用“模式”和“表达式”,如
let! pattern = expr in cexpr
以下是maybe工作流中使用模式和表达式的一些例子,其中,Option是包装类型,
// let! pattern = expr in cexpr maybe { let! x,y = Some(1,2) let! head::tail = Some( [1;2;3] ) // etc }
之前说过,我将继续使用这种非常简单的例子,不会对已经很复杂的主题再添加更多复杂的东西。
实现builder类(或者不是builder类)的特殊方法
MSDN文档说明了,每个特殊操作(如for..in,或yield)是如何被转换成builder类中的一个或多个方法调用的。
虽然没有一对一的对应关系(特殊操作与builder类方法),但是通常地,为了支持特殊操作的语法,你必须实现builder类中的一个对应的方法,否则编译器无法通过编译。
另一方面,你不必实现每个方法,如果不需要支持某个语法的话。例如,通过实现Bind和Return两个方法,我们就已经实现了maybe工作流。如果我们不需要使用Delay,Use等等,我们就不必实现这些方法。
为了能够看到如果不实现必需的方法,将会发生什么,让我们尝试在maybe工作流中石油for..in..do语法,如下
maybe { for i in [1;2;3] do i }
我们将会获得一个编译错误
This control construct may only be used if the computation expression builder defines a 'For' method
有时候会获得隐晦的错误,除非你知道后台进行了什么操作。例如,如果忘记在工作流中加Return操作,如下
maybe { 1 }
那你会获得编辑错误
This control construct may only be used if the computation expression builder defines a 'Zero' method
你可能会问:Zero方法是什么?为什么需要这个方法?答案下面会给出。
带"!"和不带"!"的操作
显然,很多特殊操作是成对出现的,即带"!"和不带"!"符号。例如,let 和 let! (发音为 let-bang),return 和 return!,yield和yield!等等。
区别其实很简单。当实现不带"!"的操作时,右边总是非包装类型,而带"!"的操作右边总是包装类型。
例如,使用maybe工作流,其中Option是包装类型,我们可以比较下面代码的语法的不同
let x = 1 // 1 is an "unwrapped" type let! x = (Some 1) // Some 1 is a "wrapped" type return 1 // 1 is an "unwrapped" type return! (Some 1) // Some 1 is a "wrapped" type yield 1 // 1 is an "unwrapped" type yield! (Some 1) // Some 1 is a "wrapped" type
带"!"的对工作流组合非常重要,因为包装类型可以是另一个相同类型的computation expression的结果
let! x = maybe {...) // "maybe" returns a "wrapped" type // bind another workflow of the same type using let! let! aMaybe = maybe {...) // create a "wrapped" type return aMaybe // return it // bind two child asyncs inside a parent async using let! let processUri uri = async { let! html = webClient.AsyncDownloadString(uri) let! links = extractLinks html ... etc ... }
以上代码中,webClinet.AsyncDownloadString(uri) 与 extractLinks html 结果为一个包装类型,故可以放在let!操作的右边。
深入——创建一个工作流的最小实现
让我们开始吧!我们开始创建一个maybe工作流的最小版本(我们将重命名它为“trace”),实现上面说过的每一个方法,可以让我们知道有了这些实现会发生什么。以后,我们就使用这个工作流作为我们的试验台。
给出trace工作流的第一个版本
type TraceBuilder() = member this.Bind(m, f) = match m with | None -> printfn "Binding with None. Exiting." | Some a -> printfn "Binding with Some(%A). Continuing" a Option.bind f m member this.Return(x) = printfn "Returning a unwrapped %A as an option" x Some x member this.ReturnFrom(m) = printfn "Returning an option (%A) directly" m m // make an instance of the workflow let trace = new TraceBuilder()
这里的代码没有什么新的内容,都是之前见过的。
现在让我们运行一些示例代码
trace { return 1 } |> printfn "Result 1: %A" trace { return! Some 2 } |> printfn "Result 2: %A" trace { let! x = Some 1 let! y = Some 2 return x + y } |> printfn "Result 3: %A" trace { let! x = None let! y = Some 1 return x + y } |> printfn "Result 4: %A"
一切都应该如期工作,尤其,你应该能够看到第四个例子中使用了None,这导致接下来的两行(let! y = ... return x+y)代码被跳过执行,整个表达式的结果是None。
介绍"do!"
我们的表达式支持let!,但是do!是什么?
在正常F#中,do就像let,除了do表达式不返回值(即,返回unit值)。
在computation expression中,do!也非常类似let!,传入一个包装类型到Bind方法中,但是do!的结果值是unit,所以传给Bind方法的是一个unit的包装类型。
以下是使用trace工作流的简单例子
trace { do! Some (printfn "...expression that returns unit") do! Some (printfn "...another expression that returns unit") let! x = Some (1) return x } |> printfn "Result from do: %A"
输出结果为
...expression that returns unit Binding with Some(<null>). Continuing ...another expression that returns unit Binding with Some(<null>). Continuing Binding with Some(1). Continuing Returning a unwrapped 1 as an option Result from do: Some 1
介绍"Zero"
最小的工作流会是什么样子?如果什么都不做,如下代码
trace { } |> printfn "Result for empty: %A"
我们会获得一个错误
This value is not a function and cannot be applied
想一下,在工作流中没有任何东西,这也没什么意义,毕竟本来的目的就是链接表达式的。
接着,如果在工作流中添加一个简单的不带let!或者return的表达式呢?
trace { printfn "hello world" } |> printfn "Result for simple expression: %A"
于是,将会获得如下错误
This control construct may only be used if the computation expression builder defines a 'Zero' method
所以你知道了什么需要Zero方法了吧?答案就是在这种情况下,没有显式返回任何东西,而computation expression整体必须返回一个包装值。那应该返回什么呢?
事实上,只要没有显式给出computation expression的返回值,就会发生上面这种情况,比如你写if..then表达式但少了else从句,就会发生同样的状况。
trace { if false then return 1 } |> printfn "Result for if without else: %A"
在正常的F#代码中,“if..then"语句不带“else”的会产生一个unit类型的结果,但是在computation expression中,返回值必须是一个包装类型,而编译器不知道这个包装值是什么。
办法就是告诉编译器该使用什么——这就是Zero方法的目的。
Zero应该使用什么值?
那Zero应该使用什么值呢?这依赖于你创建的是什么工作流。
以下几点说明也许会有帮助:
- 工作流是否有“成功”或者“失败”的概念?如果是,则为Zero使用“失败”的结果值。例如,在我们的trace工作流中,我们使用None表示失败,所以我们可以使用None作为Zero的值
- 工作流是否是顺序执行?也就是,在工作流中,一步一步的执行,包括一些在后台的处理。在一般的F#代码中,有显式返回的表达式可能会计算得到unit,所以这里类似处理,即Zero是unit的包装版本。例如,在一个option-based 工作流中,我们可能使用Some()来表示Zero(顺便一提,这跟Return()是相同的)。
- 工作流是否主要关心数据结构的操作?如果是,Zero应该是“空”数据结构。例如,在一个“list builder”工作流中,我们将使用空列表作为Zero值。
- 在组合包装类型时Zero值也扮演着重要的作用。
一个Zero的实现
让我们扩展一下我们的测试代码,使用一个返回None的Zero方法,如下
type TraceBuilder() = member this.Zero () = printfn "Zero" None let trace = new TraceBuilder() trace { printfn "hello world" } |> printfn "Result for simple expression: %A" trace { if false then return 1 | |> printfn "Return for if without else clause: %A"
通过以上测试代码我们很清楚地看到,Zero在后台被默默的调用。整个表达式的返回值为None。注意:None可能被打印成<null>。
是否总是需要Zero?
记住,不要求必须有Zero,除非它在工作流的上下文中有意义。例如,seq不允许有Zero,而async则可以
let s = seq {printfn "zero" } // Error let a = async {printfn "zero" } // OK
介绍“Yield”
C#中有“yield”语句,其作用是提前返回一个可枚举类型,以后通过迭代器在需要用到可枚举类型的元素时才获取元素值。
F# computation expressions中也有一个“yield”语句,它是干嘛的呢?
让我们尝试一下
trace { yield 1 } |> printfn "Result for yield: %A"
运行这段代码会获得一个错误
This control construct may only be used if the computation expression builder defines a 'Yield' method
这里不奇怪。那“yield”方法的实现是什么样的呢?MSDN文档给出了它的签名'T -> M<'T>,跟Return方法签名相同,即包装一个非包装类型。
所以,我们类似Return方法来实现Yield方法,并测试这个表达式
type TraceBuilder() = // other members as before member this.Yield(x) = printfn "Yield an unwrapped %A as an option" x Some x // make a new instance let trace = new TraceBuilder() // test trace { yield 1 } |> printfn "Result for yield: %A"
此时,这个工作流可以工作,看起来yield可以是return的替代品。
当然还有一个YieldFrom方法,它对应ReturnFrom方法。YieldFrom的行为类似,产生一个包装类型
那下面将YieldFrom加入builder类方法
type TraceBuilder() = // other members as before member this.YieldFrom(m) = printfn "Yield an option (%A) directly" m m // make a new instance let trace = new TraceBuilder() // test trace { yield! Some 1 } |> printfn "Result for yield!: %A"
此时,可能会想:如果return和yield几乎相同,那为何要存在这两个关键字呢?答案是,实现其中一个方法可以让我们使用某个语法,而实现另一个则不能使用这个语法。例如,seq表达式允许yield但是不允许return,而async允许return但不允许yield,如下面代码片段
let s = seq {yield 1} // OK let s = seq {return 1} // error let a = async {return 1} // OK let a = async {yield 1} // error
事实上,你可以实现让return与yield方法之间存在一些差别,那样就能达到某种目的,比如使用return停止(return)后面的computation expression的计算,而yield则不会。
更一般地,yield应该用在sequence/enumeration的场景,而return通常一次作用在一个表达式。(我们将在下一篇中看到如何多次使用yield。)
复习“For”
我们在上一篇中讨论了for..in..do语法,现在再来回顾一下“list builder”并向其中添加一些其他的方法。我们已经知道如何对一个列表定义Bind和Return方法了,故这里只要实现其他的方法定义。
Zero方法只返回一个空列表。
Yield方法实现与Return相同。
For方法实现与Bind相同。
type ListBuilder() = member this.Bind(m, f) = m |> List.collect f member this.Zero() = printfn "Zero" [] member this.Return(x) = printfn "Return an unwrapped %A as a list" x [x] member this.Yield(x) = printfn "Yield an unwrapped %A as a list" x [x] member this.For(m,f) = printfn "For %A" m this.Bind(m,f) // make an instance of the workflow let listbuilder = new ListBuilder()
下面是使用let!的代码
listbuilder { let! x = [1..3] let! y = [10;20;30] return x + y } |> printfn "Result: %A"
下面是使用for的代码
listbuilder { for x in [1..3] do for y in [10;20;30] do return x + y } |> printfn "Result: %A"
可以看到这两段代码的输出结果相同
总结
本篇我们看到了对一个简单的computation expression,如何实现它的基本的方法。
重申几点:
对简单的表达式来说,不必实现所有的方法。
- 带“!”的语句,表达式右边是包装类型
- 不带“!”的表达式右边是非包装类型
- 如果想让一个工作流不显式返回值,则必须实现Zero
- Yield与Return基本相同,但是Yield应该在sequence/enumeration语义中使用
- 在一些简单的场景中For与Bind基本相同
下一篇,我们将看到当组合多个值时会发生什么。