冒号课堂§2.2：声明范式

冒号课堂

第二课重要范式(2)

2.2声明范式——目标决定行动

给我一个支点，我能挪动地球 ——Archimedes

关键词：编程范式,命令式编程,声明式编程,函数式编程,逻辑式编程

摘要：声明式编程简谈

！预览

· 命令式编程是行动导向的，因而算法是显性而目标是隐性的；声明式编程是目标驱动的，因而目标是显性而算法是隐性的

· 声明式编程重目标、轻过程，专注问题的分析和表达而不致陷入算法的迷宫，其代码也更加简洁清晰、易于修改和维护

· 归根结底，编程是寻求一种机制，将指定的输入转化为指定的输出

？提问

什么是声明式编程？它与命令式编程有何区别？
什么是函数式和逻辑式？
变量在命令式编程和声明式编程中有何不同的涵义？
声明式语言有何优点？为什么没有命令式语言流行？
命令式语言与声明式语言有无相通之处？
编程的本质是什么？命令式、函数式和逻辑式分别采用了怎样的编程机制？

：讲解

冒号迅速转移了话题：“下面我们来谈谈与命令式编程相对的声明式编程（declarative programming）。顾名思义，声明式编程由若干规范（specification）的声明组成的，即一系列陈述句：‘已知这，求解那’，强调‘做什么’而非‘怎么做’。声明式编程是人脑思维方式的抽象，即利用数理逻辑或既定规范对已知条件进行推理或运算。”

问号询问：“声明式产生的背景是什么呢？”

“声明式编程发轫于人工智能的研究，主要包括函数式编程（functional programming，简称FP）和逻辑式编程（logic programming，简称LP）。其中，函数式编程将计算描述为数学函数的求值，而逻辑式编程通过提供一系列事实和规则来推导或论证结论。其实支持它们的语言出现得并不比命令式的晚多少——最早的函数式语言Lisp（LISt Processor）已有半个世纪的历史，最早之一的逻辑式语言Prolog（PROgramming in LOGic）也与C同龄。只是由于大多数更多地用于学术研究而非商业应用，颇有些‘养在深闺人未识’啊。”冒号有些惋惜，“起源的不同决定了这两大类范式代表着迥然不同的编程理念和风格：命令式编程是行动导向（Action-Oriented）的，因而算法是显性而目标是隐性的；声明式编程是目标驱动（Goal-Driven）的，因而目标是显性而算法是隐性的。为便于说明，我们分别用三种代表性的语言来实现阶乘（factorial）运算。”

冒号在黑板上打出投影——

C（命令式）：

int factorial(int n)

{

int f = 1;

for (; n > 0; --n) f *= n;

return f;

}

Lisp（函数式）：

(defun factorial(n)

(if (= n 0) 1 // 若n等于0，则n!等于 1

(* n (factorial(- n 1))))) // 否则n!等于n* (n-1)

Prolog（逻辑式）：

// 0! 等于1

factorial(0,1).

// 若M等于N-1且 M!等于Fm且F等于N*Fm，则N! 等于F

factorial(N,F) :- M is N-1, factorial(M,Fm), F is N * Fm.

冒号提问：“撇开语法细节，大家说说以上三段代码区别在哪里？”

句号沉思片刻，答道：“C明确给出了阶乘的迭代算法，而Lisp仅描述了阶乘的递归定义，Prolog则陈述了两个关于阶乘的断言。”

冒号很满意：“一针见血！第二个问题：你们更习惯哪一种思维方式？”

逗号不加思索：“当然是第一种！”

冒号微笑着说：“这证明你至少是受过一定训练的程序员。大家回想一下，当你们初学编程时，是否习惯这种思维方式？”

叹号沉吟道：“好像不太习惯i = i + 1之类的语句。”

“对！”冒号的一嗓子吓了众人一跳，“我们最早接触的变量是代数方程中的x、y、z等，本质上是抽象化的符号，变量值是该符号在给定约束条件下的允许值。而命令式编程中的变量本质上是抽象化的内存，变量值是该内存的储存内容。通俗地说，前者好比姓名，所指之人是固定的；后者好比住址，所住之人是变化的。此外，等号在代数中是一种约束，而在许多命令式语言中则表示赋值。因此i = i + 1可以在命令式编程中出现，但绝不可能在数学推理中出现^[1]——除非在反证法中。”

叹号又道：“现在回头再看代数，反倒有些不习惯了。”

“这就是思维的定势效应。”冒号感慨道，“声明式编程让我们重回数学思维：函数式编程类似代数中的表达式变换和计算，逻辑式编程则类似数理逻辑推理。其中的变量也如数学中的一样，是抽象符号而非内存地址，因此没有赋值运算，不会产生变量被改写的副作用（side-effect），也不存在内存分配和释放的问题。这既简化了代码，也减少了调试——不妨想一想，有多少bug是由于某个变量被意外改写或内存管理不慎而造成的？”

问号问道：“声明式语言与命令式语言看来是两个世界的产物，它们是否有相通之处？”

冒号答道：“首先，所有高级语言都建立于低级语言之上，最终转化为机器语言，声明式语言也不例外。其次，声明式语言与命令式语言并非泾渭分明，而是互相交叉渗透的。一些‘非纯粹’ 的声明式语言也提供变量赋值和流程控制，而一些命令式语言也在逐渐发展，通过利用其他程序或增加新的语言特征来实现声明式编程。总的说来，在命令式语言中融入声明式的元素应当是一种趋势。尤其是函数式，它的一些特征已经在许多命令式语言中得到了支持。比较而言，声明式编程重目标、轻过程，专注问题的分析和表达而不致陷入算法的迷宫，其代码也更加简洁清晰、易于修改和维护。从这种意义上说，声明式语言天然地就比命令式语言更高级。上节课提到的前三代计算机语言基本上都是命令式的，而后两代基本上都是声明式的，由此可见一斑。”

句号一拍脑袋：“命令式是模拟电脑的，声明式是模拟人脑的，人脑当然比电脑高级啦。”

冒号另有佐证：“早在命令式语言引入函数从而进化为过程式语言时，就已经开始向声明式过渡了。何以见得？比方说调用一个函数的语句：doWhat()，这不正是在声明‘what to do’吗？至于‘how to do’，即函数的具体实现细节，则不劳调用者费心。这种声明式的风格，提高了语言的抽象能力和开发效率，促成了语言的升级。 ”

逗号仍然有些疑惑：“既然声明式编程有这么多好处，为什么命令式语言不仅占大多数，而且流行程度也不减呢？”

冒号回答：“编程语言的流行程度与其擅长的领域关系密切。声明式语言——尤其是函数式语言和逻辑式语言——擅长基于数理逻辑的应用，如人工智能、符号处理、数据库、编译器等，对基于业务逻辑的、尤其是交互式或事件驱动型的应用就不那么得心应手了。而大多数软件是面向用户的，交互性强、多为事件驱动、业务逻辑千差万别，显然命令式语言在此更有用武之地。”

大家频频颔首。

“值得指出的是，声明式编程并不仅仅局限于函数式和逻辑式。”冒号旋即补充道，“比方说，C#中的attribute、Java中的annotation和XDoclet库等采用的也是具有声明式特征的属性导向式编程（Attribute-Oriented Programming，简称@OP）。再比如，Prograph^[2] 、SISAL^[3]等数据流语言（dataflow language）采用的数据流式编程（Dataflow Programming）与函数式编程有不少共同点，同样属于声明式的范畴。还有一些语言如Oz、CHIP等支持与逻辑式编程相交的约束式编程（Constraint Programming）^[4]。此外，大家熟悉的数据库语言SQL，样式语言XSLT、CSS，标记语言HTML、XML、SVG，规范语言IDL（Interface Description Language）等等都是声明式的。算上它们，声明式语言所占的比例也是非常可观的。此前之所以没有提及，一方面，不少声明式语言采用的范式并没有专门的名称；另一方面，这些语言大多是领域特定语言，并且不少并非图灵完备的，有的连运算都没有。毕竟，目前我们的重点还是放在通用编程语言上。”

问号突然想到了什么，指着投影问：“这里用Lisp实现阶乘的方法不也可以用在C上吗？”

冒号点点头，写下一段代码——

int factorial(int n)

{

return n == 0 ? 1 : n * factorial(n - 1);

}

“这是C的递归实现。”冒号娓娓道来，“除了细微的语法差别外，二者的确很相似，这说明用命令式语言也可以讲出声明式的味道。实际上，命令式语言提倡迭代而不鼓励递归，早期的Fortran 甚至都不支持递归。一则迭代比递归更符合命令式的思维模式，因为前者贴近机器语言而后者贴近数学语言；二则除尾递归（tail recursion）^[5]外，一般递归比迭代的开销（overhead）大。相反，声明式语言提倡递归而不支持迭代^[6]。就语法而言，它不允许迭代中的循环变量；就视角而言，迭代着眼微观过程而递归着眼宏观规律。”

叹号轻叹：“原来貌似普通的迭代和递归有那么多道道！”

“任何语言都难脱命令式或声明式的窠臼。事实上，凡是非命令式的编程都可归为声明式编程。因此，命令式、函数式和逻辑式是最核心的三种范式。为清楚起见，我们用一幅图来表示它们之间的关系。”说罢，冒号换了一个幻灯片——

末了，冒号归纳道：“归根结底，编程是寻求一种机制，将指定的输入转化为指定的输出。三种范式对此提供了截然不同的解决方案：命令式把程序看作一个自动机，输入是初始状态，输出是最终状态，编程就是设计一系列指令，通过自动机执行以完成状态转变；函数式把程序看作一个数学函数，输入是自变量，输出是因变量，编程就是设计一系列函数，通过表达式变换以完成计算；逻辑式把程序看作一个逻辑证明，输入是题设，输出是结论，编程就是设计一系列命题，通过逻辑推理以完成证明。绘成表格如下（如表2-1所示）——”

表2-1

范式	程序	输入	输出	程序设计	程序运行
命令式	自动机	初始状态	最终状态	设计指令	命令执行
函数式	数学函数	自变量	因变量	设计函数	表达式变换
逻辑式	逻辑证明	题设	结论	设计命题	逻辑推理

冒号见众人微显难色，宽慰道：“这部分理论性稍微强了些，对函数式和逻辑式也仅作了描述性说明，并未深入展开。不解之处，大可不必介怀，撒下的种子总有一天会萌动。先休息片刻，不要走开，广告之后更精彩。”

，插语

[1] 数学中应该用类似i_{n + 1} = i_n + 1的表示法。

[2] Prograph即Programming in Graphics，是一种可视化的、对象导向（OO）的数据流语言，它用图表（diagram）来取代文本编码。

[3] SISAL即Streams and Iteration in a Single Assignment Language，是一种函数式数据流语言，擅长并行科学计算。

[4] 约束式编程通过数据之间的约束关系来进行运算。它可以借助逻辑推理机制或其他数学和算法技巧来实现。有一种观点认为：用函数式、逻辑式或约束式三者之一的语言来编写程序，即是声明式编程。这种以编程语言反过来定义编程范式的说法值得商榷，但从中可看出约束式编程的代表性。

[5] 尾递归是一种特殊的递归，其递归调用出现在函数的最后一步运算（尾部）。这类递归很容易通过手工或编译器转化为迭代形式，以优化性能。

[6] 有些声明式语言（例如Lisp的一个变种Scheme）虽然支持迭代，但一般是用尾递归来实现的。从本质上说，这只是一种语法上的甜头（syntactic sugar）。它与普通迭代的区别在于：前者的循环变量是重新绑定（rebind）的，而后者的循环变量是重复赋值（reassign）的。

。总结

· 命令式编程通过一系列改变程序状态的指令来完成计算，声明式编程只描述程序应该完成的任务。命令式编程模拟电脑运算，是行动导向的，关键在于定义解法，即“怎么做”，因而算法是显性而目标是隐性的；声明式编程模拟人脑思维，是目标驱动的，关键在于描述问题，即“做什么”，因而目标是显性而算法是隐性的。

· 函数式编程通过数学函数的表达式变换和计算来求值。

· 逻辑式编程通过一系列事实和规则，利用数理逻辑来推导或论证结论。

· 命令式编程中的变量代表抽象化的内存，所存内容可能改变。声明式编程中的变量代表抽象化的符号，所指对象一般不会改变。

· 声明式编程专注问题的分析和表达而不是算法实现，不用指明执行顺序，一般没有或极少副作用，也不存在内存管理问题。这些都大大降低了编程的复杂度，同时也非常适合于并发式计算。

· 编程语言的流行程度与其擅长的领域密切相关。函数式语言和逻辑式语言擅长基于数理逻辑的应用，命令式语言擅长基于业务逻辑的、尤其是交互式或事件驱动型的应用。

· 声明式语言与命令式语言之间并无绝对的界限，它们均建立于低级语言之上，并且互相渗透融合。

· 在命令式语言中引入函数或过程，是一种向声明式风格的趋近。

· 编程是寻求一种机制，将指定的输入转化为指定的输出。

· 三种核心编程范式采用如下不同的机制——

命令式：自动机机制，通过设计指令完成从初始态到最终态的转变。

函数式：数学变换机制，通过设计函数完成从自变量到因变量的计算。

逻辑式：逻辑证明机制，通过逻辑推理完成从题设到结论的证明。

“”参考

[1] Elena Bolshakova．PROGRAMMING PARADIGMS IN COMPUTER SCIENCE EDUCATION．International Journal "Information Theories & Applications"，2005，Vol.12：285-290

[2] Ravi Sethi．Programming Languages: Concepts & Constructs(英文版第2版)．北京：机械工业出版社，2002．301-340,423-470

[3] Wikipedia．Declarative programming．http://en.wikipedia.org/wiki/Declarative_programming