Erlang 中文编程入门教程（上）

基础

Erlang 是一种多用途编程语言，主要用于开发并发和分布式系统。它最初是一种专有的编程语言，Ericsson 使用它来开发电话和通信应用程序。Erlang 在 1998 年开放了其源代码，之后，由于一些倍受瞩目的项目（比如 Facebook 聊天系统）和创新的开放源码项目（比如 CouchDB 的面向文档数据库管理系统）使用了 Erlang，Erlang 在近几年越来越流行了。在本文中，将了解 Erlang 的概况，并将它的函数编程风格与其他编程模型（比如命令式、过程式和面向对象编程）进行对比。首先，学习如何创建第一个程序（Fibonacci 递归函数）。然后，了解 Erlang 语言的基础知识，对于习惯使用 C、C++、Java™ 和 Python 的开发人员，一开始可能有点儿困难。

什么是 Erlang？

Erlang 由 Ericsson 开发，用于帮助开发管理许多电信项目的软件。Erlang 的第一个版本发布于 1986 年，1998 年发布了它的第一个开放源码版本。可以从扩展的 Erlang 版本信息中了解到，Open Telecom Platform (OTP) 是适用于 Erlang 的应用程序开发平台，也是交付 Erlang 开发环境的主要方法。

Erlang 提供许多在其他语言中不存在或难以管理的标准特性。Erlang 中之所以存在这些功能，是因为它最初用于电信领域。

例如，Erlang 包含一个非常简单的并发模型，允许在同一主机上相对轻松地多次执行代码块。除了并发之外，Erlang 还使用一个错误模型，允许识别和处理这些进程中的错误（甚至可以用新进程处理），因此可以非常轻松地构建容错能力很强的应用程序。最后，Erlang 包含内置的分布式处理，允许在一台计算机上运行组件的同时从另一台计算机请求它们。

总之，Erlang 为构建分布式、可伸缩和高性能的离散应用程序提供了良好的环境，我们常常使用这种应用程序支持现代网络和基于 web 的应用程序。

函数编程与其他范例

Erlang 与其他流行的语言之间的主要差异是，Erlang 基本上是一种函数编程语言。函数编程与语言是否支持函数无关，而是指程序操作和组件的工作方式。

在函数编程中，按照与数学计算相似的方式设计语言的函数和操作，语言通过函数执行操作，函数接收输入并生成结果。函数编程范例 (paradigm) 意味着对于相同的输入值，代码块会产生相同的输出值。因此，预测函数或程序的输出容易得多，更容易调试和分析。

与之相对的编程范例是命令式编程语言，比如 Perl 或 Java，这类语言依赖于在执行期间应用程序状态的改变。在命令式编程语言中，状态的改变意味着：对于相同的输入值，程序的组件可以根据程序当时的状态而产生不同的结果。

函数编程方式很容易理解，但是如果您习惯了过程式和关注状态的命令式语言，可能不太容易适应它。

获得 Erlang

可以从 Erlang 网站直接获得 Erlang（参见参考资料）。许多 Linux 发行版的存储库中也包含它。例如，要想在 Gentoo 上安装它，可以使用 $ emerge dev-lang/erlang。还可以使用$ apt-get install erlang 在 Ubuntu 或 Debian 发行版上安装 Erlang。

对于其他 UNIX® 和 Linux 平台，可以下载源代码并手工构建它。从源代码构建 Erlang 需要 C 编译器和 make 工具（参见参考资料）。基本步骤如下：

解压源代码：$ tar zxf otp_src_R14B01.tar.gz
切换目录：$ cd otp_src_R14B
运行配置脚本：$ ./configure
运行 make 以构建代码：$ make

还可以从 Erlang 网站获得 Windows® 安装程序（参见参考资料）。

第一个 Erlang 程序，一个递归的 Fibonacci 函数

要想了解函数编程风格的好处以及它在 Erlang 中的实现方式，最好的方法是了解 Fibonacci 函数。Fibonacci 数列是一种整数序列，可以使用以下算式计算各个 Fibonacci 值：F(n) = F(n-1) + F(n-2)。

第一个值 F(0) 的结果是 0，F(1) 的结果是 1。在此之后，通过把前两个值相加求出 F(n)。例如，F(2) 的计算过程见清单 1。

清单 1. `F(2)` 的计算过程

F(2) = F(2-1) + F(2-2)
F(2) = F(1) + F(0)
F(2) = 1 + 0
F(2) = 1

Fibonacci 数列对于许多系统（包括分析金融数据）都很重要，它还是在树结构的主干和分支上安排叶节点的基础。如果您玩过使用 3D 树的视频游戏，就会知道，这类游戏很可能使用 Fibonacci 数列来确定分支和叶的位置。

在用编程语言编写 Fibonacci 计算时，可以使用递归来实现，即函数通过调用本身从 root（F(0) 和 F(1)）开始计算数字。

在 Erlang 中，可以用变量和固定的值创建函数。这样可以简化 Fibonacci 数列的计算，因为 F(0) 和 F(1) 返回的是固定的值，而不是计算出的值。

因此，基本函数有三种情况：提供的值是 0、1 和任何更高的值。在 Erlang 中，使用分号分隔语句，所以可以用清单 2 所示的代码定义基本 Fibonacci 函数。

清单 2. 基本 Fibonacci 函数

fibo(0) -> 0 ; 
fibo(1) -> 1 ; 
fibo(N) when N > 0 -> fibo(N-1) + fibo(N-2) .

第一行定义调用 fibo(0) 的结果（-> 把定义与函数体分隔开），第二行定义调用 fibo(1) 的结果，第三行定义在提供正值 N 时执行的计算。可以这样做是因为在 Erlang 中有一个称为模式匹配的系统，后面会详细讨论这个系统。注意，最后一个语句（和 Erlang 中的所有语句）以句号结尾。实际的计算非常简单。

现在，我们来仔细查看一下 Erlang 语言的结构。

基础知识

如果您习惯了 Perl、Python 或 PHP 等语言，那么 Erlang 的结构和布局看起来可能有点儿怪，但它的某些方面会极大地简化应用程序的编写过程，让您不必为代码的许多方面操心。尤其是，Erlang 代码比其他语言少得多，某些操作、表达式和构造往往只有一行。

了解 Erlang 最简便的方法是使用 Erlang shell。安装 Erlang 之后，可以通过在命令行上执行 erl 运行 Erlang shell，参见清单 3。

清单 3. 使用 Erlang shell

$ erl
Erlang R13B04 (erts-5.7.5) [source] [rq:1] [async-threads:0]

Eshell V5.7.5  (abort with ^G)
1>

可以在提示符下输入语句（语句应该以句号结尾）。shell 会执行语句。因此，输入一个简单的求和语句会返回清单 4 所示的结果。

清单 4. 输入简单的求和语句

1> 3+4.
7

下面使用 shell 研究一些数据类型和构造。

数据类型

Erlang 支持基本数据类型（比如整数和浮点数）和更复杂的结构（比如元组和列表）。

整数和大多数整数操作与其他语言相同。可以把两个数字相加，参见清单 5。

清单 5. 将两个数字相加

1> 3+4.
7

可以使用圆括号组织算式，参见清单 6。

清单 6. 使用圆括号组织算式

2> (4+5)*9
2> .
81

注意，在清单 6 中结束语句的句号在另一行上，输入句号之后方可执行前面的计算。

在 Erlang 中，会使用浮点数代表实数，并且可以自然地表达浮点数，参见清单 7。

清单 7. 自然地表示浮点数

3> 4.5 + 6.2 . 
10.7

还可以使用指数表示浮点数，参见清单 8。

清单 8. 使用指数表示浮点数

4> 10.9E-2 +4.5
4> .
4.609

在整数和浮点数上，都支持使用标准的数学操作符（+、-、/ 和 *），可以在算式中混合使用浮点数和整数。但是，如果对浮点数使用取模和求余数操作符，则会产生错误，因为这些操作符只支持整数。

原子值

原子值是静态的（即不变的）字面值。清单 9 给出一个示例。

清单 9. 原子值

8> abc.
abc
9> 'Quoted literal'.
'Quoted literal'

原子值的使用方式应该与 C 中的 #define 相同，也就是说，作为一种明确指定或标识值的方法。因此，对于原子值，惟一合法的操作是比较。还可以将原子值的这种使用方法扩展到布尔逻辑，利用原子值 true 和 false 来标识语句的布尔结果。原子值必须以小写字母开头，否则需要加上单引号。

例如，可以比较整数并获得布尔原子值结果，参见清单 10。

清单 10. 比较整数以获得布尔原子值

10> 1 == 1.
true

还可以比较原子值，参见清单 11。

清单 11. 比较原子值

11> abc == def.
false

原子值本身按字母表次序排序（即 z 的值大于 a），参见清单 12。

清单 12. 原子值按字母表次序排序

13> a < z.
true

可以使用标准的布尔操作符，比如 and、or、xor 和 not。还可以使用 is_boolean() 函数检查提供的值是 true 还是 false。

回页首

元组

元组是复合的数据类型，用于存储数据项的集合。元组要放在花括号中（参见清单 13）。

清单 13. 元组

14> {abc, def, {0, 1}, ghi}.
{abc,def,{0,1},ghi}

一个元组的内容不必都是相同类型的。元组的构造很特殊，其中的第一个值为原子值。在这种情况下，第一个原子值称为标签，可以使用它来标识内容或对内容进行分类（参见清单 14）。

清单 14. 第一个值为原子值的元组

16> { email, 'example@example.org'}.
{email,'example@example.org'}

在这里标签是 email，可以使用标签标识此元组中其余的内容。

元组对于包含定义的元素和描述各种复杂数据结构非常有用。Erlang 允许显式地设置和获取元组中的值（参见清单 15）。

清单 15. 显式地设置和获取元组中的值

17> element(3,{abc,def,ghi,jkl}).
ghi
18> setelement(3,{abc,def,ghi,jkl},mno).
{abc,def,mno,jkl}

注意，元组元素以 1 作为第一个值的索引，而不是像其他大多数语言中那样从 0 开始。还可以将元祖作为整体进行比较（参见清单 16）。

清单 16. 作为整体比较元组

19> {abc,def} == {abc,def}.
true
20> {abc,def} == {abc,mno}.
false

列表

最后一个数据类型是列表，列表用方括号表示。列表与元组相似，但是元组只能在比较中使用，而列表允许执行的操作更多。

基本的列表如清单 17 所示。

清单 17. 基本的列表

22> [1,2,3,abc,def,ghi,[4,56,789]].
[1,2,3,abc,def,ghi,[4,56,789]]

字符串实际上是特殊类型的列表。Erlang 不直接支持字符串的概念，但是可以使用带双引号的值创建字符串值（参见清单 18）。

清单 18. 使用带双引号的值创建字符串值

23> "Hello".
"Hello"

但是，字符串实际上只是由 ASCII 字符值组成的列表。因此，上面的字符串存储为由 ASCII 字符值组成的列表（参见清单 19）。

清单 19. 字符串存储为由 ASCII 字符值组成的列表

24> [72,101,108,108,111].
"Hello"

还可以使用 $Character 表示法指定字符（参见清单 20）。

清单 20. 使用 `$Character` 表示法指定字符

25> [$H,$e,$l,$l,$o].
"Hello"

列表（包括字符串，即字符的列表）支持许多操作。这是字符串与原子值之间的主要区别。原子值是静态的标识符，但是可以通过操作字符串的组成部分（各个字符）来操作字符串。例如，不能标识原子值（比如 'Quick brown fox'）中的各个单词，因为原子值是单一实体。但是，您可以把字符串分割为单词：["Quick","brown","fox"]。

lists 模块中提供了许多用于操作列表的函数。例如，可以使用 sort 函数对列表中的数据项进行排序。因为这些是内置的函数，所以必须指定模块和函数名（参见清单 21）。

清单 21. 指定模块和函数名

34> lists:sort([4,5,3,2,6,1]).
[1,2,3,4,5,6]

列表操作

可以使用构造函数构造包含多个元素的列表，它用一个元素和另一个列表构造列表。在其他语言中，这种构造操作由用于 push() 的函数或操作符处理。在 Erlang 中，使用 |（管道）操作符分隔头（列表的开头）和尾，表达方式为 [Head|Tail]。头是单一元素，尾是列表的其余部分。

清单 22 展示了如何在列表的开头添加新的值。

清单 22. 在列表的开头添加新的值

29> [1|[2,3]].
[1,2,3]

可以重复执行这种操作以构造整个列表，参见清单 23。

清单 23. 重复执行这种操作以构造整个列表

31> [1|[2|[3|[]]]].
[1,2,3]

在这个示例中，末尾的空列表意味着您构造了一个结构良好（合适）的列表。注意，第一项必须是一个元素，不能是列表片段。如果以其他方式执行合并，则会构造一个嵌套式列表（参见清单 24）。

清单 24. 构造嵌套的列表

30> [[1,2]|[2,3]].
[[1,2],2,3]

最后，可以使用 ++ 操作符合并列表，参见清单 25。

清单 25. 使用 `++` 操作符合并列表

35> [1,2] ++ [3,4].
[1,2,3,4]

还可以从操作符左边的列表中删除右边列表中的所有元素（参见清单 26）。

清单 26. 删除列表中的元素

36> [1,2,3,4] -- [2,4].
[1,3]

因为字符串是列表，所以这些操作也适用于字符串（参见清单 27）。

清单 27. 这些操作也适用于字符串

37> "hello" ++ "world".
"helloworld"
40> ("hello" -- "ello") ++ "i".
"hi"

尽管这里只简要介绍了数据类型，但是我们希望让您对基本数据类型和操作有足够的了解。

表达式和模式匹配

在研究数据类型时，我们已经看到了许多表达式和构造。表达式的重要元素是变量。Erlang 中的变量必须以大写字母开头，后面是大写字母、小写字母和下划线的任意组合（参见清单 28）。

清单 28. Erlang 中的变量

41> Value = 99.
99

在 Erlang 中，在对变量赋值时，是一次性将值绑定到变量。绑定变量之后，就不能改变它的值（参见清单 29）。

清单 29. 将值绑定到变量

42> Value = 100.
** exception error: no match of right hand side value 100

这与大多数语言不一样 — 变量的定义通常意味着值是可变的。在 Erlang 中，只能赋值一次意味着：如果希望向计算某个值的结果，则必须将它赋值给新的变量（参见清单 30）。

清单 30. Erlang 中变量的限制

43> Sum = Value + 100
199

只能赋值一次的好处是，在计算过程中很难意外地设置或改变变量值，这让值的识别和调试变得更容易，也让代码更为清晰，有时候更简短（因为可以简化结构）。

注意，这种操作意味着先计算出值，然后把值绑定到变量。在其他语言中，可以根据函数或操作的引用设置值，这意味着值取决于访问它时引用的值。在 Erlang 中，在创建变量时它的值总是已知的。

可以使用 f(Varname) 显式地忽略一个变量的绑定，或使用 f() 忽略所有变量的绑定。

为变量赋值实际上就是一种特殊的模式匹配。Erlang 中的模式匹配还会处理各个语句的执行流，以及从复合数据类型（元组、数组）中提取出值。模式匹配的基本形式是：模式 = 表达式。

表达式由数据结构、绑定的变量（即具有值的变量）、数学操作符和函数调用组成。操作的两边必须匹配（也就是说，如果模式是包含两个元素的元组，那么表达式的计算结果也必须是包含两个元素的元组）。在执行表达式时，计算表达式并将结果赋值给模式。

例如，可以使用一个模式匹配同时为两个变量赋值（参见清单 31）。

清单 31. 同时给两个变量赋值

48> {A,B} = {(9+45),abc}.
{54,abc}

注意，如果模式是绑定的变量，或者模式的元素是绑定的变量，那么模式匹配的结果就会变成比较。此操作支持实现强大的选择性赋值。例如，为了从元组中获取姓名和电子邮件地址，可以使用以下模式匹配：{contact, Name, Email} = {contact, "Me", "me@example.com"}。

最后，可以按前面提到的构造表示方法，使用模式匹配从列表或元组中提取元素。例如，清单 32 展示了如何获得列表中的前两个元素，同时保留其余元素。

清单 32. 获得列表中的前两个元素，同时保留其余元素

53> [A,B|C] = [1,2,3,4,5,6].
[1,2,3,4,5,6]

A 赋值为 1，B 赋值为 2，C 赋值为列表的其余部分。

函数

与其他语言一样，Erlang 中的函数是所有程序的基本组成部分。函数由函数名（由一个原子值定义）和圆括号中的零个或更多函数参数组成：sum(N,M) -> N+M。

函数必须在文件中的模块中定义（不能在 shell 中定义函数）。参数可以包含复合数据类型。例如，可以使用元组中的标签选择不同的操作（参见清单 33）。

清单 33. 可以使用元组中的标签选择不同的操作

mathexp({sum, N,M}) -> N+M ;
mathexp({sub, N,M}) -> N-M ;
mathexp({square, N}) -> N*N.

分号是每个函数定义之间的 “或” 操作符。使用模式匹配评估函数的参数，所以如果把包含三个元素的元组提供给 mathexp() 函数，模式匹配会失败。

Erlang 中的函数还可以接受不同数量的参数。Erlang 会执行模式匹配，直到找到有效的函数定义，从而选择适当的函数定义。函数的参数数量称为元数 (arity)，用于帮助标识函数。

再看一下 Fibonacci 示例，现在您就会发现，当调用 fibo(0) 时，模式与函数的第一个定义匹配，fibo(1) 与第二个定义匹配，其他值与最后一个定义匹配。这也解释了函数执行的递归是如何实现的。例如，在调用 fibo(9) 时，可以使用相应的值调用 fibo(N) 函数定义，直到到达fibo(0) 和 fibo(1) 函数定义（它们返回固定的值）。

任何函数的返回值都是子句（在我们的示例中只有一行）中最后一个表达式的结果。注意，只有在找到了匹配项且变量是函数局部变量的情况下，才会为变量赋值。

模块

与其他语言中的模块一样，模块用于把相似的函数集中在一起。

在文件中指定模块名（必须与文件名匹配），然后指定模块中希望导出到装载此模块的其他程序的函数。例如，清单 34 给出了文件 fib.erl，其中包含 fib 模块的定义。

清单 34. fib.erl 文件

-module(fib).
-export([fibo/1, printfibo/1]).

%% print fibo arg. and result, with function as parameter

printfibo(N) -> 
   Res = fib:fibo(N),
   io:fwrite("~w ~w~n", [N, Res]).

fibo(0) -> 0 ; 
fibo(1) -> 1 ; 
fibo(N) when N > 0 -> fibo(N-1) + fibo(N-2) .

模块声明位于 -module() 行中。-export() 行包含要导出的函数的列表。每个函数的定义都给出了函数名和函数的元数，以便您能导出函数的特定定义。

要使用模块，则需要编译并装载模块。可以在 shell 中使用 c() 语句完成这个步骤，参见清单 35。

清单 35. 使用 `c()` 语句编译并装载模块

1> c(fib).
{ok,fib}
2> fib:printfibo(9).
9 34
ok

注意，函数调用包含模块名，从而确保调用的是 fib 模块中的 printfibo() 函数。

结束语

Erlang 的结构和格式与大多数其他语言有很大区别。尽管许多数据类型和基本的表达式是相同的，但是它们的用法和应用不太一样。变量只能赋值一次，通过模式匹配系统对不同的表达式进行运算，这些特性给典型的语言环境提供了一些强大的扩展。例如，可以为同一函数定义多种处理方式，还可以对递归调用应用模式匹配，这样做可以简化某些函数。

在下一篇文章中，我们将讨论 Erlang 的进程、消息解析和网络功能，并通过研究 MochiWeb HTTP 服务器了解这种语言的强大功能和灵活性。

参考资料

学习

Erlang 网站：寻找关于这种编程语言的更多信息。
Erlang 的 Wikipedia 条目：进一步了解 Erlang 的历史。
由 Martin Logan、Eric Merritt 和 Richard Carlsson 合著并由 Manning Publications 出版的Erlang and OTP in Action 讲解了如何使用 Erlang 和 OTP 框架创建实用的应用程序。
由 Francesco Cesarini 和 Simon Thompson 合著并由 O'Reilly Media 出版的Erlang Programming: A Concurrent Approach to Software Development 深入解释了 Erlang，这种编程语言非常适合要求并发性、容错能力和快速响应的任何场合。
由 Joe Armstrong 撰写并由 Pragmatic Programming 出版的 Programming Erlang: Software for a Concurrent World 讲解如何用 Erlang 编程语言编写高可靠性的应用程序（甚至能够应对网络和硬件故障）。
developerWorks Web development 专区：寻找讨论各种基于 web 的解决方案的文章。
developerWorks 演示中心：观看免费的演示，了解 IBM 及开放源码技术和产品功能。
随时关注 developerWorks 技术活动和网络广播。
访问 developerWorks Open source 专区获得丰富的 how-to 信息、工具和项目更新以及最受欢迎的文章和教程，帮助您用开放源码技术进行开发，并将它们与 IBM 产品结合使用。

获得产品和技术

Erlang：下载 Erlang 编程语言。
Apache CouchDB 项目：CouchDB 是使用 MochiWeb HTTP 服务器用 Erlang 编写的，可以从 Apache 获取它。

posted @ 2014-03-03 21:00 高盛阅读(7766) 评论(0) 收藏举报

刷新页面返回顶部