深入理解JavaScript内部原理(3): this
本文是翻译 http://dmitrysoshnikov.com/ecmascript/chapter-3-this/
概要
本文将进一步讨论与执行上下文密切相关的概念——this关键字。
事实证明,this这块的内容非常的复杂,它在不同执行上下文的情况下其值都会不同,并且会相应的引发一些问题。
很多程序员一看到this关键字,就会把它和面向对象的编程方式联系在一起,它指向利用构造器新创建出来的对象。在ECMAScript中,也支持this,然而, 正如大家所熟知的,this不仅仅只用来表示创建出来的对象。
接下来给大家揭开在ECMAScript中this神秘的面纱。
定义
This是执行上下文的一个属性:
activeExecutionContext = {
VO: {...},
this: thisValue
};
这里的VO就是前一章介绍的变量对象。
This与上下文的可执行代码类型有关,其值在进入上下文阶段就确定了,并且在执行代码阶段是不能改变的。
让我们来详细的看看this在ECMAScript中式如何表现的。
全局代码中This的值
这种情况下,一切都变得非常简单,this的值总是全局对象本身;因此,可以间接地获取引用:
// 显式定义全局对象的属性
this.a = 10; // global.a = 10
alert(a); // 10
// 通过赋值给不受限的标识符来进行隐式定义
b = 20;
alert(this.b); // 20
// 通过变量声明来进行隐式定义
// 因为全局上下文中的变量对象就是全局对象本身
var c = 30;
alert(this.c); // 30
函数代码中This的值
当this在函数代码中的时候,事情就变得有趣多了。这种情况下是最复杂的,并且会引发很多的问题。
函数代码中this值的第一个特性(同时也是最主要的特性)就是:它并非静态的绑定在函数上。
正如此前提到的,this的值是在进入上下文的阶段确定的,并且在函数代码中的话,其值每次都会大不相同。
然而,一旦进入执行代码阶段,其值就不能改变了。比方说,要想给this赋一个新的值是不可能的,因为this根本就不是变量(相反的,在Python语言中,它显示定义的self对象是可以在运行时随意更改的):
var foo = {x: 10};
var bar = {
x: 20,
test: function () {
alert(this === bar); // true
alert(this.x); // 20
this = foo; // error, 不能更改this的值
alert(this.x); // 如果没有错误,则其值为10而不是20
}
};
// 在进入上下文的时候,this的值就确定了是“bar”对象
// 至于为什么,会在后面作详细介绍
bar.test(); // true, 20
foo.test = bar.test;
// 但是,这个时候,this的值又会变成“foo”
// 纵然我们调用的是同一个函数
foo.test(); // false, 10
因此,在函数代码中影响this值的因素是有很多的。
首先,在一般的函数调用中,this的值是由激活上下文代码的调用者决定的,比如说,调用函数的外层上下文。this的值是由调用表达式的形式决定的。
理解并谨记这一点是非常必要的,有利于在任何上下文中都能准确的确定this的值。
影响调用上下文中的this的值的只有可能是调用表达式的形式,也就是调用函数的方式。 (一些关于JavaScript的文章和书籍中指出的“this的值取决于函数的定义方式,如果是全局函数,则this的值就会设置为全局对象,如果是某个对象的方法,则this的值就会设置为该对象”——这纯属扯淡,根本就是在误人子弟)。 正如此前大家看到的,纵然是全局函数,this的值也会随着函数调用方式的不同而不同:
function foo() {
alert(this);
}
foo(); // global
alert(foo === foo.prototype.constructor); // true
// 然而,同样的函数,以另外一种调用方式的话,this的值就不同了
foo.prototype.constructor(); // foo.prototype
调用一个对象的某个方法的时候,this的值也有可能不是该对象的:
var foo = {
bar: function () {
alert(this);
alert(this === foo);
}
};
foo.bar(); // foo, true
var exampleFunc = foo.bar;
alert(exampleFunc === foo.bar); // true
// 同样地,相同的函数以不同的调用方式,this的值也就不同了
exampleFunc(); // global, false
那么,究竟调用表达式的方式是如何影响this的值的呢?为了完全搞明白这其中的奥妙,首先,这里有必要先介绍一种内部类型——引用类型(the Reference type)。
引用类型
引用类型的值可以用伪代码表示为一个拥有两个属性的对象——base属性(属性所属的对象)以及该base对象中的propertyName属性:
var valueOfReferenceType = {
base: ,
propertyName:
};
引用类型的值只有可能是以下两种情况:
- 当处理一个标识符的时候
- 或者进行属性访问的时候
关于标识符的处理会在第四章——所用域链中作介绍,这里我们只要注意的是,此算法总返回一个引用类型的值(这对this的值是至关重要的)。
标识符其实就是变量名,函数名,函数参数名以及全局对象的未受限的属性。如下所示:
var foo = 10;
function bar() {}
中间过程中,对应的引用类型的值如下所示:
var fooReference = { base: global, propertyName: 'foo' }; var barReference = { base: global, propertyName: 'bar' };
要从引用类型的值中获取一个对象实际的值需要GetValue方法,该方法用伪代码可以描述成如下形式:
function GetValue(value) { if (Type(value) != Reference) { return value; } var base = GetBase(value); if (base === null) { throw new ReferenceError; } return base.[[Get]](GetPropertyName(value)); }
上述代码中的[[Get]]方法返回了对象属性实际的值,包括从原型链中继承的属性:
GetValue(fooReference); // 10
GetValue(barReference); // function object "bar"
对于属性访问来说,有两种方式: 点符号(这时属性名是正确的标识符并且提前已经知道了)或者中括号符号:
foo.bar();
foo['bar']();
中间过程中,得到如下的引用类型的值:
var fooBarReference = {
base: foo,
propertyName: 'bar'
};
GetValue(fooBarReference); // function object "bar"
问题又来了,引用类型的值又是如何影响函数上下文中this的值的呢?——非常重要。这也是本文的重点。总的来说,决定函数上下文中this的值的规则如下所示:
函数上下文中this的值是函数调用者提供并且由当前调用表达式的形式而定的。 如果在调用括号()的左边,有引用类型的值,那么this的值就会设置为该引用类型值的base对象。 所有其他情况下(非引用类型),this的值总是null。然而,由于null对于this来说没有任何意义,因此会隐式转换为全局对象。
如下所示:
function foo() { return this; } foo(); // global
上述代码中,调用括号的左侧是引用类型的值(因为foo是标识符):
var fooReference = { base: global, propertyName: 'foo' };
相应的,this的值会设置为引用类型值的base对象,这里就是全局对象。
属性访问也是类似的:
var foo = {
bar: function () {
return this;
}
};
foo.bar(); // foo
同样的,也是引用类型的值,它的base对象是foo对象,激活bar函数的时候,this的值就设置为foo对象了:
var fooBarReference = {
base: foo,
propertyName: 'bar'
};
然而,同样的函数以不同的激活方式的话,this的值就完全不同了:
var test = foo.bar;
test(); // global
因为test也是标识符,这样就产生了另外的引用类型的值,其中base对象(全局对象)就是this的值:
var testReference = { base: global, propertyName: 'test' };
至此,我们就可以精确的解释,为什么同样的函数,以不同的调用方式激活,this的值也会不同了——答案就是处理过程中,是不同的引用类型的值:
function foo() {
alert(this);
}
foo(); // global, 因为
var fooReference = {
base: global,
propertyName: 'foo'
};
alert(foo === foo.prototype.constructor); // true
// 另一种调用方式
foo.prototype.constructor(); // foo.prototype, 因为
var fooPrototypeConstructorReference = {
base: foo.prototype,
propertyName: 'constructor'
};
如下是另外一种(典型的)利用调用表达式来动态决定this值的例子:
function foo() {
alert(this.bar);
}
var x = {bar: 10};
var y = {bar: 20};
x.test = foo;
y.test = foo;
x.test(); // 10
y.test(); // 20
函数调用以及非引用类型
正如此前提到过的,当调用括号左侧为非引用类型的时候,this的值会设置为null,并最终变成全局对象。
我们来考虑下如下表达式:
(function () {
alert(this); // null => global
})();
上述例子中,有函数对象,但非引用类型对象(因为它不既不是标识符也不属于属性访问),因此,this的值最终设置为全局对象。
如下是更为复杂的例子:
var foo = {
bar: function () {
alert(this);
}
};
foo.bar(); // Reference, OK => foo
(foo.bar)(); // Reference, OK => foo
(foo.bar = foo.bar)(); // global?
(false || foo.bar)(); // global?
(foo.bar, foo.bar)(); // global?
看了上述代码,你可能又有疑问了:为什么明明是属性访问,但是最终this的值不是base对象而是全局对象呢?
这里主要疑问在最后三个表达式,这三个表达式添加了特定的操作之后,调用括号左侧就不再是引用类型的值了。
第一种情况——非常明确,是引用类型,最终this的值设置为base对象,foo。
第二种情况有一个组操作符(grouping operator),该操作符不会触发调用获取引用类型实际值的方法,比如:GetValue方法。 相应的,处理组操作符中间过程中——获得的仍然是一个引用类型的值,这也就解释了为什么this的值设置成了base对象,foo。
第三种情况是一个赋值操作符(assignment operator),与组操作符不同的是,它会触发调用GetValue方法(参见11.13.1中的第三步)。 最后返回的时候就是一个函数对象了(而不是引用类型的值了),这就意味着this的值会设置为null,最终会变成全局对象。
第四和第五种情况也是类似的——逗号操作符和OR逻辑表达式都会触发调用GetValue方法,于是相应地就会丢失原先的引用类型值,变成了函数类型,this的值就变成了全局对象了。
引用类型以及null(this的值)
有这么一种情况下,当调用表达式左侧是引用类型的值,但是this的值却是null,最终变为全局对象。 发生这种情况的条件是当引用类型值的base对象恰好为活跃对象。
当内部子函数在父函数中被调用的时候就会发生这种情况。正如第二章介绍的, 局部变量,内部函数以及函数的形参都会存储在指定函数的活跃对象中:
function foo() {
function bar() {
alert(this); // global
}
bar(); // 和AO.bar()是一样的
}
活跃对象总是会返回this值为——null(用伪代码来表示,AO.bar()就相当于null.bar())。然后,如此前描述的,this的值最终会由null变为全局对象。
当函数调用包含在with语句的代码块中,并且with对象包含一个函数属性的时候,就会出现例外的情况。with语句会将该对象添加到作用域链的最前面,在活跃对象的之前。 相应地,在引用类型的值(标识符或者属性访问)的情况下,base对象就不再是活跃对象了,而是with语句的对象。另外,值得一提的是,它不仅仅只针对内部函数,全局函数也是如此, 原因就是with对象掩盖了作用域链中更高层的对象(全局对象或者活跃对象):
var x = 10;
with ({
foo: function () {
alert(this.x);
},
x: 20
}) {
foo(); // 20
}
// because
var fooReference = {
base: __withObject,
propertyName: 'foo'
};
当调用的函数恰好是catch从句的参数时,情况也是类似的:在这种情况下,catch对象也会添加到作用域链的最前面,在活跃对象和全局对象之前。 然而,这个行为在ECMA-262-3中被指出是个bug,并且已经在ECMA-262-5中修正了;因此,在这种情况下,this的值应该设置为全局对象,而不是catch对象。
try {
throw function () {
alert(this);
};
} catch (e) {
e(); // __catchObject - in ES3, global - fixed in ES5
}
// on idea
var eReference = {
base: __catchObject,
propertyName: 'e'
};
// 然而,既然这是个bug
// 那就应该强制设置为全局对象
// null => global
var eReference = {
base: global,
propertyName: 'e'
};
同样的情况还会在递归调用一个非匿名函数的时候发生(函数相关的内容会在第五章作相应的介绍)。在第一次函数调用的时候,base对象是外层的活跃对象(或者全局对象), 在接下来的递归调用的时候——base对象应当是一个存储了可选的函数表达式名字的特殊对象,然而,事实却是,在这种情况下,this的值永远都是全局对象:
(function foo(bar) {
alert(this);
!bar && foo(1); // "should" be special object, but always (correct) global
})(); // global
当函数作为构造器被调用时this的值
这里要介绍的是函数上下文中关于this值的另外一种情况——当函数作为构造器被调用的时候:
function A() {
alert(this); // newly created object, below - "a" object
this.x = 10;
}
var a = new A();
alert(a.x); // 10
在这种情况下,new操作符会调用“A”函数的内部[[Construct]]。 在对象创建之后,会调用内部的[[Call]]函数,然后所有“A”函数中this的值会设置为新创建的对象。
手动设置函数调用时this的值
Function.prototype上定义了两个方法(因此,它们对所有函数而言都是可访问的),允许手动指定函数调用时this的值。这两个方法是:.apply和.call; 它们都接受第一个参数作为调用上下文中this的值。而它们的不同点其实无关紧要:对于.apply来说,第二个参数接受数组类型(或者是类数组的对象,比如arguments), 而.call方法接受任意多的参数。这两个方法只有第一个参数是必要的——this的值。
如下所示:
var b = 10; function a(c) { alert(this.b); alert(c); } a(20); // this === global, this.b == 10, c == 20 a.call({b: 20}, 30); // this === {b: 20}, this.b == 20, c == 30 a.apply({b: 30}, [40]) // this === {b: 30}, this.b == 30, c == 40
总结
本文我们讨论了ECMAScript中this关键字的特性(相对C++或者Java而言,真的可以说是特性)。洗完此文对大家理解this关键字在ECMAScript中的工作原理有所帮助。