JS函数式编程【译】5.1 范畴论

范畴论

范畴论是用于函数组合的理论性概念。范畴论和函数组合它俩在一起就像发动机排量和马力,像NASA和空间穿梭, 像好酒和装它的瓶子。基本上讲,你不能让它们中的一个脱离另一个而独立存在。

范畴论概览

范畴论实际并不是一个很难的概念。在数学上它大到能够填满一个本科课程,但是在计算机编程中它可以很容易地被总结出来。

爱因斯坦曾说过:“如果你不能把它解释给一个六岁的孩子听,那你自己也没有理解”。这样,按照给六岁孩子解释的说法, 范畴论只不过是一些连接的圆点。也许这过分简化了范畴论,不过这从直观的方式上很好的解释了我们所需要知道的东西。

首先你需要了解一些术语。范畴(category,也可以说是种类)只是一些同样类型的集合。 在JavaScript里,它们是数组或对象,包含了明确指定为数字、字符串、布尔、日期或节点等类型的变量。 态射(Morphism)是一些纯函数,当给定一系列输入时总会返回相同的输出。 多态操作可以操作多个范畴,而同态操作限制在一个单独的范畴中。 例如,同态函数“乘”只能作用于数字,而多态函数“加”还能作用于字符串。

下图展示了三个范畴——A、B、C,以及两个态射——fg

范畴论告诉我们,当第一个态射的范畴是另一个态射所需的输入时,它们就可以像下图所示这样组合:

f o g符号代表态射f和g的组合。现在我们就可以连接这些圆点。

真的是这样,只是连接圆点。

我插两句:作者老说范畴论就是圆点,但是也没看到个圆点。可以认为f o g中间的圆圈就是圆点 (中间不是字母o而是圆圈,我实在找不到合适的字符)。因为在haskell里,函数组合的形式就是f.g。

类型安全

我们来连接一些圆点。范畴包含两样东西:

  1. 对象 Object(在JavaScript中是类型)。
  2. 态射 Morphisms(在JavaScript中是只作用于类型的纯函数)。

这是数学赋予范畴论的术语,所以不幸与我们的JavaScript的术语集有些冲突。 范畴论中的对象更像是代表一个指定数据类型的变量,而不是像JavaScript所定义的对象那样具有一系列属性和值。 态射只是使用这些类型的纯函数。

所以JavaScript应用范畴论很简单。在JavaScript中使用范畴论意味着每个范畴只使用一个特定的数据类型。 数据类型是指数字、字符串、数组、日期、对象、布尔等等。但是JavaScript没有严格的类型系统,很容易出岔子。 所以我们不得不实现我们自己的方法来保证数据的正确

JavaScript中有四种原始类型:number、string、Boolean、function。我们可以创建类型安全函数, 返回变量或者抛出一个错误。这符合范畴论的对象定理。

var str = function(s) {
  if (typeof s === "string") {
    return s;
  } else {
    throw new TypeError("Error: String expected, " + typeof s + "given.");
  }
}
var num = function(n) {
  if (typeof n === "number") {
    return n;
  } else {
    throw new TypeError("Error: Number expected, " + typeof n + "given.");
  }
}
var bool = function(b) {
  if (typeof b === "boolean") {
    return b;
  } else {
    throw new TypeError("Error: Boolean expected, " + typeof b + "given.");
  }
}
var func = function(f) {
  if (typeof f === "function") {
    return f;
  } else {
    throw new TypeError("Error: Function expected, " + typeof f +
      " given.");
  }
}

然而这里重复代码太多,并且不是很函数式。我们可以创建一个函数,它返回一个类型安全的函数。

var typeOf = function(type) {
  return function(x) {
    if (typeof x === type) {
      return x;
    } else {
      throw new TypeError("Error: " + type + " expected, " + typeof x +
        "given.");
    }
  }
}
var str = typeOf('string'),
  num = typeOf('number'),
  func = typeOf('function'),
  bool = typeOf('boolean');
typeof = (type) ->
  (x) ->
    if typeof x is type
      x
    else
      throw new TypeError("Error:  expected, undefined given.")
str = typeOf('string')
num = typeOf('number')
func = typeOf('function')
bool = typeOf('boolean')

现在,我们可以利用这些函数让我们的函数像预期那样运行。

// 未受保护的方法
var x = '24';
x + 1; // 会返回'241',而不是25
// 受保护的方法
// plusplus :: Int -> Int
function plusplus(n) {
  return num(n) + 1;
}
plusplus(x); // 抛出错误,防止出现意外的结果

再来看个有点肉的例子。我们想检查Unix时间戳的长度,由JavaScript函数Date.parse()返回的值是数字而不是字符串, 我们得用str()函数。

// timestampLength :: String -> Int
function timestampLength(t) { return num(str(t).length); }
timestampLength(Date.parse('12/31/1999')); // 抛出错误
timestampLength(Date.parse('12/31/1999').toString()); // 返回12

像这样把明确地一个类型转换为另一个类型(或者是相同的类型)的函数叫做态射。这符合范畴论的态射定理。 这里强迫通过类型安全函数进行类型声明,利用了这个机制的态射是我们在JavaScript中展示范畴概念所需的一切。

对象识别

另外还有一种重要的数据类型:对象。

var obj = typeOf('object');
obj(123); // 抛出错误
obj({x:'a'}); // 返回 {x:'a'}

然而,对象各不相同。它们可以被继承。任何非原始类型(number、string、Boolean、function)的东西都是对象, 包括数组、日期、元素等等。

没有办法知道一个对象是个什么类型,也就是说没法通过typeof关键字知道JavaScript的对象的子类型是什么, 所以我们得想办法。Object有个toString()函数,我们可以通过它变通实现这个目的。

var obj = function(o) {
  if (Object.prototype.toString.call(o) === "[object Object]") {
    return o;
  } else {
    throw new TypeError("Error: Object expected, something else given.");
  }
}

同样,对于各种对象,我们要实现代码重用:

var objectTypeOf = function(name) {
  return function(o) {
    if (Object.prototype.toString.call(o) === "[object " + name + "]") {
      return o;
    } else {
      throw new TypeError(
        "Error: '+name+' expected, something else given.");
    }
  }
}
var obj = objectTypeOf('Object');
var arr = objectTypeOf('Array');
var date = objectTypeOf('Date');
var div = objectTypeOf('HTMLDivElement');

这对下一个主题函子非常有用。

posted @ 2015-10-14 14:28  tolg  阅读(2030)  评论(0编辑  收藏  举报