【转】OCaml程序的结构

出自:http://www.nirvanastudio.org/ocaml/the-structure-of-ocaml-programs.html

原文地址：http://www.ocaml-tutorial.org/the_structure_of_ocaml_programs 翻译：ShiningRay

现在我们花些时间从一个更高的层次来看看实际的OCaml程序。我想教一下关于局部和全局定义，什么时候使用;;，什么时候是;，以及模块、嵌套函数和引用。这样我们就要看这些以前毫无概念没见过的OCaml概念了，不过现在还不用担心细节问题。首先关注程序整体结构以及我指出的一些特点。

局部“变量”（实际上是局部表达式，local expressions)

让我们先拿average函数看一下，并在C语言中添加一个局部变量（可以拿它和我们之前第一次的定义进行一下比较）。

double
average (double a, double b)
{
  double sum = a + b;
  return sum / 2;
}

现在我们在OCaml的版本中也做同样的事情：

let average a b =
  let sum = a +. b in
   sum /. 2.0;;

# let average a   b= (a+.b)/.2.0;; 注意优先级别.
val pjz : float -> float -> float = <fun>
# pjz 10.5 21.5;;
- : float = 16.
#

标准短语let name = expression in可以用于定义一个局部表达式，然后name就可以在后面的函数中使用，来替代expression了，直到结束该代码块的;;出现。注意在in后面我们并没有缩进。就把let...in当作是一个语句。

现在将C的局部变量和这些命名的局部表达式进行比较，好像是差不多的。其实他们是两种不同的东西。C变量sum在栈上有一个分配给它的槽。如果需要，你可以在函数中以后给sum分配值，甚至可以获取sum的地址。但是这对于OCaml版本却不正确。在OCaml版本中，sum只是表达式a +. b的缩写。不可能对sum赋值或者改变它的值。（稍后会给你看如何才能制造真正的变量）。

下面是另一个例子，可以把事情讲的更加清楚。下面两个代码片断将返回同样的值（也就是 (a+b) + (a+b)²）：

let f a b =
  (a +. b) +. (a +. b) ** 2.
   ;;

let f a b =
  let x = a +. b in
   x +. x ** 2.
   ;;

第二个版本可能会快一点（不过现在大多数编译器都应该可以直接为你完成“消除重复子表达式”工作），同时它也更加容易阅读。第二个例子中的x仅仅是a +. b的缩写。

全局“变量”（实际上是全局表达式）

你也可以在最顶层为某些东西定义全局名字，同时与上面我们所说的局部“变量”一样，这些都完全不是真正的变量，仅仅是某些东西的别名。下面是一个实际应用的例子（做了删减）：

let html =
  let content = read_whole_file file in
   GHtml.html_from_string content
   ;;
 
let menu_bold () =
  match bold_button#active with
    true -> html#set_font_style ~enable:[`BOLD] ()
   | false -> html#set_font_style ~disable:[`BOLD] ()
   ;;
 
let main () =
  (* 代码省略 *)
   factory#add_item "Cut" ~key:_X ~callback: html#cut
   ;;

在这段实际的代码中，html是一个HTML编辑部件（来自lablgtk库的一个对象），它是由第一行语句let html=一次性在程序开始的时候创建的。然后在后面的函数中被多次引用。

注意上面的代码段中的html名字不能当作是一个和C或者其他命令式语言中的实际的全局变量。并没有为“html指针”分配任何空间进行“存储”。也不能对html分配任何值，例如重新将其分配指向另一个不同的部件。在下面的一节中，我们将讨论引用，这才是真正的变量。

Let-绑定

任何let ...的使用，无论在最顶层（全局的），或在一个函数中，一般都称之为let-绑定。

引用：真正的变量

如果你需要一个真正的变量对其进行赋值，并可在程序中使用、更改，那要怎样呢？这时候就需要用到引用（reference）。引用和C/C++中的指针十分类似。在Java中，所有保存对象的变量实际上都是对象的引用（指针）。在Perl中，引用就是引用——和OCaml中的是同一个东西。

下面是我们如何在OCaml中创建指向一个int值得引用：

ref 0;;

事实上，这个语句并没有什么大的用途。我们仅仅创建了一个引用，但因为我们并没有给它命名，所以垃圾收集器会过来将其立刻回收！（实际上，它也可能在编译期就被扔掉了）。让我们来给这个引用命名吧：

let my_ref = ref 0;;

# let myvar= ref "hello";;
val myvar : string ref = {contents = "hello"}
#

这个引用目前存储了一个整数零。下面我们再将一些别的东西放进去（赋值）：

my_ref := 100;;

同时看看现在这个引用里面包含什么：

# !my_ref;;
- : int = 100

显示变量数值

# !myvar
   ;;
- : string = "hello"
#

所以，:=操作符是用于为引用赋值的，同时!操作符可以解除引用获取实际的内容。下面是一个与C/C++大致的比较：

OCaml                   C/C++

let my_ref = ref 0;;    int a = 0; int *my_ptr = &a;
my_ref := 100;;         *my_ptr = 100;
!my_ref                 *my_ptr

引用有他们的用途，但是你也可能发现并不会经常用到引用。更多的时候，你会在函数定义中使用let name = expression in来命名局部表达式。

嵌套函数

C实际上并没有嵌套函数的概念。GCC支持C程序的嵌套函数，但我还不知道有什么程序会实际使用这个扩展。不管怎样，先看看gcc info页面是如何解释嵌套函数的：

一个“嵌套函数”是指定义在另一个函数中的函数。（GNU C++并不支持嵌套函数。）嵌套函数的名称是局限于它所定义的代码块中的。例如，下面我们定义一个叫做`square'的嵌套函数，并调用两次：

foo (double a, double b)
{
  double square (double z) { return z * z; }
 
  return square (a) + square (b);
}

嵌套函数可以访问任何包含它的函数中定义时所能看到的变量。这叫做“词法范围”（lexical scoping）。例如，下面我们展示一下使用了叫做`offset'的继承了的变量的嵌套函数：

bar (int *array, int offset, int size)
{
  int access (int *array, int index)
    { return array[index + offset]; }
  int i;
  /* ... */
  for (i = 0; i < size; i++)
    /* ... */ access (array, i) /* ... */
}

你应该有点明白了。不过，嵌套函数在OCaml中是十分有用而且十分常用的。下面是从一些实际应用代码中截取的嵌套函数的例子：

let read_whole_channel chan =
  let buf = Buffer.create 4096 in
  let rec loop () =
    let newline = input_line chan in
    Buffer.add_string buf newline;
    Buffer.add_char buf '\n';
     loop ()
  in
  try
     loop ()
  with
     End_of_file -> Buffer.contents buf;;

先无需关心这段代码干了什么——它还包含了尚未在本教程中讨论的很多概念。先关注中间的叫做“loop”的嵌套函数，它只有一个单元参数。你可以调用在函数read_whole_channel中调用loop ()，但它并没有在这个函数外边定义。嵌套函数可以访问定义在主函数中的变量（这里loop可以访问局部名称buf）。

嵌套函数的形式和局部命名表达式的形式是一样的：let name 形参 = 函数定义 in。

一般来说，你要将在新的一行上缩进函数定义，如上面的例子所示，同时记住如果函数是递归的，要使用let rec而非let（如上面例子所示）。

posted on 2011-04-29 09:42 小交响曲阅读(1416) 评论(0) 编辑收藏举报

刷新页面返回顶部

刺客