JavaScript 原型与继承机制详解

 引言

  初识 JavaScript 对象的时候,我以为 JS 是没有继承这种说法的,虽说 JS 是一门面向对象语言,可是面向对象的一些特性在 JS 中并不存在(比如多态,不过严格来说也没有继承)。这就困惑了我很长的时间,当我学习到 JS 原型的时候,我才发现了 JS 的新世界。本篇文章讲解了 JavaScript new 操作符与对象的关系、原型和对象关联(也就是俗称的继承)的原理,适合有一定基础的同学阅读。

 一、JavaScript 的类与对象

  许多书籍上都会说到如何在 JS 当中定义“类”,通常来讲就是使用如下代码:

1 function foo () {
2     this.x = 1;
3     this.y = 2;
4 }
5 var obj = new foo();  //{x:1, y:2}

  实际上这一个很糟糕的语言机制,我们首先要明确,在 JS 当中根本没有“类”这种东西。在了解它之前,我们要先来了解下 JS 的发展历史。

  JavaScript 随着互联网和浏览器而诞生,在早些年代,互联网还比较贫乏,上网的成本也比较高,网速非常的慢,通常需要花很长的时间才能传输完一个纯文本的 HTML 文件。所以那时候 Netscape 就提出,需要有一种解决方案,能使一些操作在客户端进行而不需要通过服务器处理,比如用户在填写邮箱的时候少写了一个“@”,在客户端就可以检查出错误并提示用户而不需要在服务器进行解析,这样就可以极大的降低通信操作带来了延迟和带宽消耗。而那时候,正巧 JAVA 问世,火的那叫个一塌糊涂,所以 Netscape 决定和 SUN 合作,在浏览器当中植入 JAVA 小程序(后来称Java applet)。不过后来就这一方案产生了争议,因为浏览器本来只需要很小的操作,而 JAVA 语言本身太“重”了,用来处理什么表单验证的问题实在是大材小用,所以决定开发一门新的语言来支持客户端的轻量级操作,而又要借鉴 JAVA 的语法。于是乎 Netscape 开发出了一门新的轻量级语言,在语法方面偏向于 C 和 JAVA,在数据结构方面偏向于 JAVA,这门语言最初叫做 Mocha,后来经过多年的演变,变成了现在的 JavaScript。

  故事说道这里,好像和本文并没有什么关系...别急,马上就要说道点子上了。这个语言为什么要取名 JavaScript 呢,其实它和 JAVA 并没有半毛钱的关系,只是因为在那点年代,面向对象方法问世才不久,所有的程序员都推崇学习面向对象方法,再加上 JAVA 的横空出世和大力宣传,只要和 JAVA 沾边的东西就像是往脸上贴了金一样,自带光环。所以便借助了 JAVA 的名气来进行宣传,不过光是嘴皮子宣传还不行,因为面向对象方法的推崇,大家都习惯于面向对象的语法,也就是 new Class() 的方法编写代码。不过 JavaScript 语言本身并没有类的概念,其是多种语言的大杂烩,为了更加贴合习惯了面向对象语法的程序员,于是 new 操作符诞生了。

  好了,说了这么大一堆故事,就是想告诉同学们,new 操作符在 JavaScript 当中本身就是一个充满歧义的东西,它并不存在类的概念,只是贴合程序员习惯而已。那么在 JavaScript 当中 new 操作符和对象究竟有什么关系呢?思考下面这一段代码:

1 function foo () {
2     this.x = 1;
3     this.y = 2;
4     return {
5         z:3
6     }
7 }
8 var obj = new foo();  //{z:3}

  咦?发生了什么奇怪的事情,x 和 y 哪里去了?实际上 new 操作符并不是传统面向对象语言那样,创建一个类的实例,new 操作符实际上只是在引擎内部帮我们在函数的开始创建好了一个对象,然后将函数的上下文绑定到这个对象上面,并在函数的末尾返回这个对象。这里需要注意的问题是,如果我们手动的返回了一个对象,那么按照函数执行机制,一旦返回了一个值,那么该函数也就执行结束,后面的代码将不会执行,所以说在刚才的例子中我们得到的对象只是我们手动定义的对象,并不是引擎帮我们创建的对象。 new 操作符实际上类似于以下操作:

1 function foo () {
2     //新创建一个对象,将 this 绑定到该对象上
3     
4     //在这里编写我们想要的代码
5 
6     //return this;
7 }

  不过需要注意的是,new 操作符只接受 Object 类型的值,如果我们手动返回的是基本类型,则还是会返回 this :

1 function foo () {
2     this.x = 1;
3     this.y = 2;
4     return 0;
5 }
6 var obj = new foo();  //{x:1, y:2}

  现在我们现在可以将 new 操作符定义成以下方法:

 1 function newOpertor (cls, ...args) {
 2     var obj = {};
 3     cls.apply(obj, args);
 4     return obj;
 5 }
 6 
 7 function foo (x, y) {
 8     this.x = x;
 9     this.y = y;
10 }
11 
12 var obj = newOpertor(foo, 1, 2);  //{x:1, y:2}

 二、对象的原型

   JavaScript 中存在类似继承的机制,但是又不是标准面向对象的继承,在 JS 中使用的是原型的机制。要记住,在 JS 中只有对象,没有类,对象的继承是由原型来实现,笼统的来说可以这样理解,一个对象是另一个对象的原型,那么便可以把它比作父类,子类既然也就继承了父类的属性和方法。

1 function foo () {
2     this.x = 1;
3     this.y = 2;
4 }
5 
6 foo.prototype.z = 3
7 
8 var obj = new foo();
9 console.log(obj.z);  //3

  [[prototype]] 是函数的一个属性,这个属性的值是一个对象,该对象是所有以该函数为构造器创造的对象的原型。可以把它近似的理解为父类对象,那么相应的,子类自然会继承父类的属性和方法。不过为什么要区分原型继承和类继承的概念呢?标准的面向对象方法,类是不具有实际内存空间,只是一个事物的抽象,对象才是事物的实体,而通过继承得到的属性和方法,同属于该对象,不同的对象各自都拥有独立的继承而来的属性。不过在 JavaScript 当中,由于没有类的概念,一直都是对象,所以我们“继承”的,是一个具有实际内存空间的对象,也是实体,也就是说,所有新创建的子对象,他们共享一个父对象(后面我统称为原型),不会拥有独立的属性:

 1 function foo () {
 2     this.x = 1;
 3     this.y = 2;
 4 }
 5 
 6 foo.prototype.z = 3
 7 
 8 var obj1 = new foo();
 9 
10 console.log(obj1.z);  //3
11 
12 foo.prototype.z = 2
13 
14 console.log(obj1.z);  //2

  还记得我们之前所说的 new 操作符的原理吗?new 操作符的本质不是实例化一个类,而是引擎贴合习惯了面向对象编程方法的程序员,所以说 [[prototype]] 属性本质上也是 new 操作符的一个副产物。这个属性只在函数上面有意义,该属性定义了 new 操作符产生的对象的原型。除了 [[prototype]] 可以访问到对象原型以外,还有一个非标准的方法,在每一个对象中都有一个 __proto__ 属性,这个属性直接关联到了该对象的原型。这种方法没有写入 W3C 的标准规范,但是却得到了浏览器的广泛支持,许多浏览器都提供了该方法以供访问对象的原型。(个人觉得 __proto__ 比 [[prototype]] 更能体现原型链的本质)

 1 function foo () {
 2     this.x = 1;
 3     this.y = 2;
 4 }
 5 
 6 foo.prototype.z = 3
 7 
 8 var obj1 = new foo();
 9 
10 console.log(obj1.__proto__);  //{z:3}

  除了使用 new 操作符和函数的 [[prototype]] 属性定义对象的原型之外,我们还可以直接在对象上显示的通过 __proto_ 来定义,这种定义对象原型的方式更能够体现出 JavaScript 语言的本质,更能够使初学者理解原型链继承的机制。

1 var father = {x:1};
2 
3 var child = {
4     y:2,
5     __proto__:father
6 };
7 
8 console.log(child.x);  //1

  现在我们来完成之前那个自定义 new 操作(如果你还不能理解这个函数,没有关系,跳过它,这并不影响你接下来的学习):

 1 function newOpertor (cls, ...args) {
 2     var obj = Object.create(cls.prototype);
 3     cls.apply(obj, args);
 4     return obj;
 5 }
 6 
 7 function foo (x, y) {
 8     this.x = x;
 9     this.y = y;
10 }
11 
12 foo.prototype.z = 3
13 
14 var obj1 = newOpertor(foo, 1, 2)
15 
16 console.log(obj1.z);  //3

 三、原型链

  介绍完原型之后,同学们需要明确以下几个概念:

  •   JavaScript 采用原型的机制实现继承;
  •   原型是一个具有实际空间的对象,所有关联的子对象共享一个原型;

  那么 JavaScript 当中的原型是如何实现相互关联的呢?JS 引擎又是如何查找这些关联的属性呢?如何实现多个对象的关联形成一条原型链呢?

 1 var obj1 = {
 2     x:1
 3 }
 4 
 5 var obj2 = {
 6     y:2,
 7     __proto__:obj1
 8 }
 9 
10 var obj3 = {
11     z:3,
12     __proto__:obj2
13 }
14 
15 console.log(obj3.y);  //2
16 console.log(obj3.x);  //1

  在上面这段代码,我们可以看出,对象的原型可以实现多层级的关联的操作,obj1 是 obj2 的原型, obj2 同时又是 obj3 的原型,这种多层级的原型关联,就是我们常说的原型链。在访问一个处于原型链当中的对象的属性,会沿着原型链对象一直向上查找,我们可以把这种原型遍历操作看成是一个单向的链表,每一个处于原型链的对象都是链表当中的一个节点,JS 引擎会沿着这条链表一层一层的向下查找属性,如果找到了一个与之匹配的属性名,则返回该属性的值,如果在原型链的末端(也就是 Object.prototype)都没有找到与之匹配的属性,则返回 undefined。要注意这种查找方式只会返回第一个与之匹配的属性,所以会发生属性屏蔽:

 1 var obj1 = {
 2     x:1
 3 }
 4 
 5 var obj2 = {
 6     x:2,
 7     __proto__:obj1
 8 }
 9 
10 var obj3 = {
11     x:3,
12     __proto__:obj2
13 }
14 
15 console.log(obj3.x);  //3

  若要访问原型的属性,则需要一层的一层的先向上访问原型对象:

1 console.log(obj3.__proto__.x);  //2
2 console.log(obj3.__proto__.__proto__.x);  //1

  要注意的一点是,原型链的遍历只会发生在 [[getter]] 操作上,也就是取值操作,也可以称之右查找(RHS)。相反,若是进行 [[setter]] 操作,也就是赋值操作,也可以称作左查找(LHS),则不会遍历原型链,这条原则保证了我们在对对象进行操作的时候不会影响到原型链:

 1 var obj1 = {
 2     x:1
 3 }
 4 
 5 var obj2 = {
 6     __proto__:obj1
 7 }
 8 
 9 console.log(obj2.x);  //1
10 
11 obj2.x = 2;
12 
13 console.log(obj2.x);  //2
14 console.log(obj1.x);  //1(并没有发生变化)

   在遍历原型链中,如果访问带有 this 引用的方法,可能会发生令你意想不到的结果:

 1 var obj1 = {
 2     x:1,
 3     foo: function  () {
 4         console.log(this.x);
 5     }
 6 }
 7 
 8 var obj2 = {
 9     x:2,
10     __proto__:obj1
11 }
12 
13 obj2.foo();  //2

  在上面的内容中,我们讨论过,对象的原型相当于父类,我们可以继承它所拥有的属性和方法,所以在我们访问 foo() 函数的时候时候,实际上调用该方法的对象是 obj2 而不是 obj1。关于更详细的内容,需要了解 this 和上下文绑定,这不在本篇文章的讨论范围之内。

  关于原型链的问题,大家需要理解的一点是,任何对象的原型链终点,都是 Object.prototype,可以把 Object 理解为所有对象的父类,类似于 JAVA 一样,所以说所有对象都可以调用一些 Object.prototype 上面的方法,比如 Object.prototype.valueOf() 以及 Object.prototype.toString() 等等。所有的 string 类型,其原型为 String.prototype ,String.prototype 是一个对象,所以其原型也就是 Object.prototype。这就是我们为什么能够在一个 string 类型的值上调用一些方法,比如 String.prototype.concat() 等等。同理所有数组类型的值其原型是 Array.prototype,数字类型的值其原型是 Number.prototype:

1 console.log({}.__proto__ === Object.prototype);  //true
2 
3 console.log("hello".__proto__ === String.prototype);  //true
4 
5 console.log(1..__proto__ === Number.prototype);  //true
6 //注意用字面量访问数字类型方法时,第一个点默认是小数标志
7 
8 console.log([].__proto__ === Array.prototype);  //true

   理解了原型链的遍历操作,我们现在就可以学习如何添加属于自己的方法。我们现在知道了所有字符串的原型都是 String.prototype ,那么我们可以对其进行修改来设置我们自己的内置方法:

1 String.prototype.foo = function () {
2     return this + " foo";
3 }
4 
5 console.log("bar".foo());  //bar foo

  所以说,在处理一些浏览器兼容性问题的时候,我们可以直接修改内置对象来兼容一些旧浏览器不支持的方法,比如 String.prototype.trim() :

1 if (!String.prototype.trim) {
2     String.prototype.trim = function() {
3         return this.replace(/^[\s\uFEFF\xA0]+|[\s\uFEFF\xA0]+$/g, '');
4     };
5 }

  不过需要注意,切忌随意修改内置对象的原型方法,一是因为这会带来额外的内存消耗,二是这可能会在系统中造成一些隐患,一般只是用来做浏览器兼容的 polyfill 。

四、 有关原型的方法

   for ... in 语句会遍历原型链上所有可枚举的属性(关于属性的可枚举性质,可以参考 《JavaScript 常量定义》),有时我们在操作的时候需要忽略掉原型链上的属性,只访问该对象上的属性,这时候我们可以使用 Object.prototype.hasOwnProperty() 方法来判断属性是否属于原型属性:

 1 var obj1 = {
 2     x:1,
 3 }
 4 
 5 var obj2 = {
 6     y:2,
 7     __proto__:obj1
 8 }
 9 
10 for(var key in obj2){
11     console.log(obj2[key]);  //2, 1
12 }
13 
14 for(var key in obj2){
15     if(obj2.hasOwnProperty(key)){
16         console.log(obj2[key]);  //2
17     }
18 }

  我们知道通过 new 操作符创建的对象可以通过 instanceof 关键字来查看对象的“类”:

1 function foo () {}
2 
3 var obj = new foo();
4 
5 console.log(obj instanceof foo);  //true

  实际上这个操作也是不严谨的,我们现在已经知道了 new 操作符在 JavaScript 当中本是一个具有歧义设计,instanceof 操作符本身也是一个会让人误解的操作符,它并没有实例这种说法,实际上这个操作符只是判断了对象与函数原型的关联性,也就是说其返回的是表达式 object.__proto__ === function.prototype 的值。

 1 function foo () {}
 2 
 3 var bar = {
 4     x:1
 5 }
 6 
 7 foo.prototype = bar
 8 
 9 var obj = {
10     __proto__: bar
11 }
12 
13 console.log(obj instanceof foo);  //true

  在这一段代码中,我们可以看出 obj 和 foo 并没有任何关系,只是 obj 的原型和 foo.prototype 关联到了同一个对象上面,所以其结果会返回 true。  

  不过对基本类型类型使用 instanceof 方法的话,可能会产生意外的结果:

1 console.log("1" instanceof String);  //false
2 
3 console.log(1 instanceof Number);  //false
4 
5 console.log(true instanceof Boolean);  //false

  但是我们同样可以使用使用字面量调用原型的方法,这可能会让人感到困惑,不过我们不用担心它,并不是原型链出现什么毛病,而是在对基本类型进行字面量操作的时候,会涉及到隐式转换的问题。JS 引擎会先将字面量转换成内置对象,然后在调用上面的方法,隐式转换问题不在本文的讨论范围之类,大家可以参考 Kyle Simpson — 《你不知道的 JavaScript (中卷)》。

  实际对象的 Object.prototype.isPrototypeOf() 方法更能体现出对象原型链的关系,此方法判断一个对象是否是另一个对象的原型,不同于 instanceof 的是,此方法会遍历原型链上所有的节点,此方法作用于对象,而 instanceof 方法作用于构造器,其都会遍历原型链上所有的节点:

 1 var obj1 = {
 2 }
 3 
 4 var obj2 = {
 5     __proto__:obj1
 6 }
 7 
 8 var obj3 = {
 9     __proto__:obj2
10 }
11 
12 console.log(obj2.isPrototypeOf(obj3));  //true
13 console.log(obj1.isPrototypeOf(obj3));  //true
14 console.log(Object.prototype.isPrototypeOf(obj3));  //true

  在 ES5 当中拥有标准方法 Object.getPrototypeOf() 可以供我们获得一个对象的原型,在ES6 当中拥有新的方法 Object.setPrototypeOf() 可以设置一个对象的原型,不过在使用之前请先查看浏览器兼容性。

 1 var obj1 = {
 2     x:1
 3 }
 4 
 5 var obj2 = {
 6     y:2
 7 }
 8 
 9 Object.setPrototypeOf(obj2, obj1);
10 
11 console.log(Object.getPrototypeOf(obj2) === obj1);  //true

  我们现在知道,通过 new 操作符创建的对象,其原型会关联到函数的 [[prototype]] 上面,实际上这是一个很糟糕的写法,一味的贴合面向对象风格的编程模式,使得很多人无法领域 JavaScript 当中的精髓。许多书籍都会写到 JavaScript 中有许多奇怪的地方,然后教你如何避开这些地雷,实际上这不是一个好的做法,并不是因为 JavaScript 是一门稀奇古怪的语言,而是我们不愿意去面对它的特性,正确的理解这些特性,才能让我们写出更加高效的程序。Object.create() 方法对于对象之间的关联和原型链的机制更加清晰,比 new 操作符更加能够理解 JavaScript 的继承机制。该方法创建一个新对象,并使新对象的原型关联到参数对象当中:

1 var obj1 = {
2     x:1
3 }
4 
5 var obj2 = Object.create(obj1);
6 
7 console.log(obj1.isPrototypeOf(obj2));  //true

  不过使用的时候还需要注意浏览器的兼容性,下面给出 MDN 上面的 polyfill:

 1 (function() {
 2     if (typeof Object.create != 'function') {
 3         Object.create = (function() {
 4             function Temp() {}
 5             var hasOwn = Object.prototype.hasOwnProperty;
 6             return function(O) {
 7                 if (typeof O != 'object') {
 8                     throw TypeError('Object prototype may only be an Object or null');
 9                 }
10                 Temp.prototype = O;
11                 var obj = new Temp();
12                 Temp.prototype = null;
13                 if (arguments.length > 1) {
14                     var Properties = Object(arguments[1]);
15                     for (var prop in Properties) {
16                         if (hasOwn.call(Properties, prop)) {
17                             obj[prop] = Properties[prop];
18                         }
19                     }
20                 }
21                 return obj;
22             };
23         })();
24     }
25 })();

  关于 Object.create() 方法要注意的一点是,如果参数为 null 那么会创建一个空链接的对象,由于这个对象没有任何原型链,所以说它不具有任何原生的方法,也无法进行原型的判断操作,这种特殊的对象常被称作“字典”,它完全不会受原型链的干扰,所以说适合用来存储数据:

 1 var obj = Object.create(null);
 2 obj.x = 1
 3 
 4 var bar = Object.create(obj);
 5 bar.y = 2;
 6 
 7 console.log(Object.getPrototypeOf(obj));  //null
 8 
 9 console.log(Object.prototype.isPrototypeOf(obj));  //false
10 
11 console.log(obj instanceof Object);  //false
12 
13 console.log(bar.x);  //1
14 
15 obj.isPrototypeOf(bar);  //TypeError: obj.isPrototypeOf is not a function
16 
17 /**
18  * 注意由于对象没有关联到 Object.prototype 上面,所以无法调用原生方法,但这并不影响此对象的关联操作。
19  */

 总结

  原型链是 JavaScript 当中非常重要的一点,同时也是比较难理解的一点,因为其与传统的面向对象语言有着非常大的区别,但这是正是 JavaScript 这门语言的精髓所在,关于原型与原型链,我们需要知道以下这几点:

  •   JavaScript 通过原型来实现继承操作;
  •   几乎所有对象都有原型链,其末端是 Object.prototype;
  •   原型链上的 [[getter]] 操作会遍历整条原型链,[[setter]] 操作只会针对于当前对象;
  •   我们可以通过修改原型链上的方法来添加我们想要的操作(最好不要这样做);

  关于 JavaScript 原型链,在一开始人们都称为“继承”,其实这是一种不严谨的说法,因为这不是标准的面向对象方法,不过初期人人常常这么理解。现在我往往称之为关联委托,关联指的是一个对象关联到另一个对象上,而委托则指的是一个对象可以调用另一个对象的方法。

  本篇文章均为个人理解,如有不足或纰漏,欢迎在评论区指出。

 参考文献:

  Kyle Simpson — 《你不知道的 JavaScript (上卷)》

  MDN — Object - JavaScript | MDN

  阮一峰 — JavaScript 语言的历史

posted @ 2017-07-08 11:17  Shelton_Dong  阅读(1318)  评论(0编辑  收藏  举报