【转】OCaml程序的结构
出自:http://www.nirvanastudio.org/ocaml/the-structure-of-ocaml-programs.html
原文地址:http://www.ocaml-tutorial.org/the_structure_of_ocaml_programs 翻译:ShiningRay
现在我们花些时间从一个更高的层次来看看实际的OCaml程序。我想教一下关于局部和全局定义,什么时候使用;;
,什么时候是;
,以及模块、嵌套函数和引用。这样我们就要看这些以前毫无概念没见过的OCaml概念了,不过现在还不用担心细节问题。首先关注程序整体结构以及我指出的一些特点。
局部“变量”(实际上是 局部表达式,local expressions)
让我们先拿average
函数看一下,并在C语言中添加一个局部变量(可以拿它和我们之前第一次的定义进行一下比较)。
double
average (double a, double b)
{
double sum = a + b;
return sum / 2;
}
现在我们在OCaml的版本中也做同样的事情:
let average a b =
let sum = a +. b in
sum /. 2.0;;
# let average a b= (a+.b)/.2.0;; 注意优先级别.
val pjz : float -> float -> float = <fun>
# pjz 10.5 21.5;;
- : float = 16.
#
标准短语let name = expression in
可以用于定义一个局部表达式,然后name
就可以在后面的函数中使用,来替代expression
了,直到结束该代码块的;;
出现。注意在in
后面我们并没有缩进。就把let...in
当作是一个语句。
现在将C的局部变量和这些命名的局部表达式进行比较,好像是差不多的。其实他们是两种不同的东西。C变量sum
在栈上有一个分配给它的槽。如果需要,你可以在函数中以后给sum
分配值,甚至可以获取sum
的地址。但是这对于OCaml版本却不正确。在OCaml版本中,sum
只是表达式a +. b
的缩写。不可能对sum
赋值或者改变它的值。(稍后会给你看如何才能制造真正的变量)。
下面是另一个例子,可以把事情讲的更加清楚。下面两个代码片断将返回同样的值(也就是 (a+b) + (a+b)2):
let f a b =
(a +. b) +. (a +. b) ** 2.
;;
let f a b =
let x = a +. b in
x +. x ** 2.
;;
第二个版本可能会快一点(不过现在大多数编译器都应该可以直接为你完成“消除重复子表达式”工作),同时它也更加容易阅读。第二个例子中的x
仅仅是a +. b
的缩写。
全局“变量”(实际上是全局表达式)
你也可以在最顶层为某些东西定义全局名字,同时与上面我们所说的局部“变量”一样,这些都完全不是真正的变量,仅仅是某些东西的别名。下面是一个实际应用的例子(做了删减):
let html =
let content = read_whole_file file in
GHtml.html_from_string content
;;
let menu_bold () =
match bold_button#active with
true -> html#set_font_style ~enable:[`BOLD] ()
| false -> html#set_font_style ~disable:[`BOLD] ()
;;
let main () =
(* 代码省略 *)
factory#add_item "Cut" ~key:_X ~callback: html#cut
;;
在这段实际的代码中,html
是一个HTML编辑部件(来自lablgtk库的一个对象),它是由第一行语句let html=
一次性在程序开始的时候创建的。然后在后面的函数中被多次引用。
注意上面的代码段中的html
名字不能当作是一个和C或者其他命令式语言中的实际的全局变量。并没有为“html
指针”分配任何空间进行“存储”。也不能对html
分配任何值,例如重新将其分配指向另一个不同的部件。在下面的一节中,我们将讨论引用,这才是真正的变量。
Let-绑定
任何let ...
的使用,无论在最顶层(全局的),或在一个函数中,一般都称之为let-绑定。
引用:真正的变量
如果你需要一个真正的变量对其进行赋值,并可在程序中使用、更改,那要怎样呢?这时候就需要用到引用(reference)。引用和C/C++中的指针十分类似。在Java中,所有保存对象的变量实际上都是对象的引用(指针)。在Perl中,引用就是引用——和OCaml中的是同一个东西。
下面是我们如何在OCaml中创建指向一个int
值得引用:
ref 0;;
事实上,这个语句并没有什么大的用途。我们仅仅创建了一个引用,但因为我们并没有给它命名,所以垃圾收集器会过来将其立刻回收!(实际上,它也可能在编译期就被扔掉了)。让我们来给这个引用命名吧:
let my_ref = ref 0;;
# let myvar= ref "hello";;
val myvar : string ref = {contents = "hello"}
#
这个引用目前存储了一个整数零。下面我们再将一些别的东西放进去(赋值):
my_ref := 100;;
同时看看现在这个引用里面包含什么:
# !my_ref;;
- : int = 100
显示变量数值
# !myvar
;;
- : string = "hello"
#
所以,:=
操作符是用于为引用赋值的,同时!
操作符可以解除引用获取实际的内容。 下面是一个与C/C++大致的比较:
OCaml C/C++
let my_ref = ref 0;; int a = 0; int *my_ptr = &a;
my_ref := 100;; *my_ptr = 100;
!my_ref *my_ptr
引用有他们的用途,但是你也可能发现并不会经常用到引用。更多的时候,你会在函数定义中使用let name = expression in
来命名局部表达式。
嵌套函数
C实际上并没有嵌套函数的概念。GCC支持C程序的嵌套函数,但我还不知道有什么程序会实际使用这个扩展。不管怎样,先看看gcc info页面是如何解释嵌套函数的:
一个“嵌套函数”是指定义在另一个函数中的函数。(GNU C++并不支持嵌套函数。)嵌套函数的名称是局限于它所定义的代码块中的。例如,下面我们定义一个叫做`square'的嵌套函数,并调用两次:
foo (double a, double b)
{
double square (double z) { return z * z; }
return square (a) + square (b);
}
嵌套函数可以访问任何包含它的函数中定义时所能看到的变量。这叫做“词法范围”(lexical scoping)。例如,下面我们展示一下使用了叫做`offset'的继承了的变量的嵌套函数:
bar (int *array, int offset, int size)
{
int access (int *array, int index)
{ return array[index + offset]; }
int i;
/* ... */
for (i = 0; i < size; i++)
/* ... */ access (array, i) /* ... */
}
你应该有点明白了。不过,嵌套函数在OCaml中是十分有用而且十分常用的。下面是从一些实际应用代码中截取的嵌套函数的例子:
let read_whole_channel chan =
let buf = Buffer.create 4096 in
let rec loop () =
let newline = input_line chan in
Buffer.add_string buf newline;
Buffer.add_char buf '\n';
loop ()
in
try
loop ()
with
End_of_file -> Buffer.contents buf;;
先无需关心这段代码干了什么——它还包含了尚未在本教程中讨论的很多概念。先关注中间的叫做“loop
”的嵌套函数,它只有一个单元参数。你可以调用在函数read_whole_channel
中调用loop ()
,但它并没有在这个函数外边定义。嵌套函数可以访问定义在主函数中的变量(这里loop
可以访问局部名称buf
)。
嵌套函数的形式和局部命名表达式的形式是一样的:let name 形参 = 函数定义 in
。
一般来说,你要将在新的一行上缩进函数定义,如上面的例子所示,同时记住如果函数是递归的,要使用let rec
而非let
(如上面例子所示)。